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ET ”上海 交 通 大 学 计算 机 科学 及 工程 系 教授 、 博 士 生 导师 。 在 科研 方 
面 ， 主 要 从 事 操作 系统 和 分 布 对 象 计算 技术 方面 的 研究 ， 在 教学 方面 ， 长 期 承 
担 操作 系统 及 分 布 计算 等 课程 的 教学 工作 。 主 编 和 翻译 了 多 本 操作 系统 教材 和 
参考 书 ， 包 括 《UNIX 操 作 系统 教程 》、《UNIX 高 级 编程 技术 》、《UNIX 环 境 高 级 
编程 》 和 《操作 系统 : 设计 与 实现 》 等 。 


张 亚 英 ” 博士， 毕业 于 上 海 交通 大 学 计算 机 软件 与 理论 专业 ， 现 任教 于 同 
济 大 学 计算 机 系 。 研 究 方向 为 分 布 与 移动 计算 、 骸 人 式 系统 以 及 系统 软件 等 。 


威 正 伟 ” 博士， 毕业 于 上 海 交通 大 学 计算 机 软件 与 理论 专业 ， 现 任教 于 上 
海 交通 大 学 软件 学 院 。 主 要 研究 领域 为 分 布 式 计算 、 形 式 化 方法 以 及 事务 处 理 。 
在 国内 外 发 表 论文 十 余 篇 。 
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Advance Programming in the UNIX Environment 问世 于 1992 年 ， 作 者 是 UNIX 和 网 络 技术 领域 
的 国际 知名 专家 W. Richard Stevens。 该 书 出 版 以 来 受到 读者 的 普遍 欢迎 和 好 评 ， 认 为 它 是 “在 
UNIX 环 境 下 进行 程序 设计 的 有 关 人 员 必 读 且 经 常 需 要 查阅 的 首选 参考 书 ”。UNIX 的 原创 者 
Dennis Ritchie 则 称 其 是 “公认 的 优秀 、 匠 心 独 具 的 名 著 ”。 自 第 1 版 以 来 ，UNIX 系 统 及 相关 产业 
已 经 发 生 了 很 多 变化 ， 特 别 是 UNIX 相 关 标准 的 制定 取得 很 大 进展 ，UNIX 系 统 采用 的 某 些 新 技术 
已 日 趋 成 熟 ， 典 型 的 UNIX 系 统 平台 也 有 所 改变 ， 而 Linux 的 兴起 、 抉 速 发 展 和 广泛 应 用 更 为 世人 
有 瞩目。 这 些 都 使 得 该 书 有 修订 的 必要 ， 以 反映 这 些 变化 。 由 于 W. Richard Stevens 已 于 1999 年 辞世 ， 
所 以 读书 的 出 版 商 美 国 Addison Wesley 公 司 邀 请 原作 者 的 好 友 ， 同 样 在 UNIX 领 域 中 有 很 深造 训 的 
Stephen A. Rago 承 担 了 修订 该 书 的 工作 。 经 修订 后 ，Advance Programming in the UNIX Environment 
第 2 版 于 2005 年 出 版 。 它 既 保 持 了 原 书 的 基本 结构 、 内 容 和 风格 ， 又 有 一 定 幅度 的 增删 ， 全 书 依 
据 POSIX.! 的 最 新 标准 改写 , 内 容 更 加 丰富 , 在 线程 和 多 线程 编程 以 及 套 接 字 方 面 增加 了 专门 章节 ， 
使 用 的 典型 平台 更 改 为 FreeBSD 5.2.1, Linux 2.4.22, Solaris 9 和 Darwin 7.4.0。 另 外 Stephen A. 
Rago 在 UNIX 编 程 方面 也 具有 极 丰 富 的 经 验 ， 这 些 都 非常 自然 地 反映 到 了 本 版 中 。 除 此 之 外 ， 
第 2 版 的 主要 特点 与 第 1 版 基本 相同 : 

(1) 内 容 丰 富 实 用 ， 包 含 了 在 UNIX 环 境 下 进行 程序 设计 所 需 的 各 方面 内 容 。 它 既 能 满足 UNIX 
环境 下 一 般 程序 设计 人 员 的 要 求 ， 又 常常 能 使 需要 解决 各 种 疑难 问题 的 高 级 程序 设计 人 员 找 到 满 

(2) 提供 了 大 量 应 用 实例 。 书 中 既 有 说 明 单个 系统 调用 和 库 函 数 使 用 方法 的 小 程序 ， 也 有 综 
合 应 用 它们 的 较 大 程序 。 这 些 程序 的 源 代码 总 计 10 000 行 以 上 ， 全 部 用 ISO C 编 写 。 

(3) 为 了 说 明 系 统 调用 和 库 函 数 的 应 用 技术 及 其 可 能 发 生 的 各 种 问题 ， 在 必要 时 对 UNIX 内 核 
的 数据 结构 和 算法 进行 了 说 明 。 这 种 理论 与 应 用 实践 的 结合 ， 非 常 有 助 于 读者 提高 程序 设计 的 水 
平 。 

本 书 的 第 11 章 、 第 12 章 以 及 索引 由 同济 大 学 计算 机 系 张 亚 英 博士 翻译 ， 第 16 章 和 第 21 章 由 上 

海 交 通 大 学 软件 学 院 威 正 伟 博 士 翻 译 ， 上 海 交 通 大 学 计算 机 系 尤 晋 元 教授 翻译 了 其 余 章 节 ， 并 对 
全 书 进行 统 稿 。 本 书 第 1 版 中 译本 于 2000 年 出 版 以 来 ， 很 多 读者 对 其 提出 了 许多 宝贵 意见 ， 在 本 
版 中 我 们 尽量 采纳 了 这 些 意见 。 同 时 ， 我 们 的 工作 还 得 到 上 海 交通 大 学 计算 机 系 陈 英 副教授 、 唐 
新 怀 博士 、 贺 小 箭 博 士 和 计算 机 系 以 及 软件 学 院 许多 学 生 (EEN. PEE, WH. BBE. 
AGE, SUM. BRAS) 的 帮助 ， 在 此 一 并 表示 感谢 。 还 要 特别 感谢 人 民 邮 电 出 版 社 
图 灵 公司 的 武 卫 东 、 杨 海 玲 等 在 本 书 的 策划 、 编 辑 及 出 版 方面 所 做 的 努力 。 

我 们 希望 本 书 的 出 版 对 相关 科技 人 员 和 读者 会 有 所 帮助 ， 同 时 也 期 待 广大 专家 和 读者 提出 宝 
贵 意见 。 
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我 差不多 每 次 在 接受 专访 当中 ， 或 是 做 技术 讲座 后 的 提问 时 间 里 ， 总 会 被 问 及 这 样 一 个 问题 
“你 想到 过 UNIX 会 生存 这 么 长 时 间 吗 ? ”自然 ， 每 次 的 回答 都 是 ， 没有 ， 我 们 没 想到 会 是 这 样 。 
从 某 种 角度 说 ，UNIX 系 统 已 经 伴随 了 商用 计算 行业 历史 的 大 半 ， 而 这 也 早 就 不 是 什么 新 闻 了 。 

发 展 的 历程 错综复杂 ， 充 满 变 数 。 自 20 世 纪 70 年 代 初 以 来 ， 计 算 机 技术 经 历 了 沧海 桑田 
般 的 变化 ， 尤 其 体现 在 网 络 技术 的 普遍 应 用 、 图 形 化 的 无 所 不 在 和 个 人 计算 的 触手 可 及 ， 然 
而 UNIX 系 统 却 奇 迹 般 地 容纳 和 适应 了 所 有 这 些 变化 。 虽 然 商业 应 用 环境 在 桌面 领域 目前 仍然 
为 微软 和 英特尔 所 统治 ， 但 是 在 某 些 方面 已 经 从 单一 供应 商 向 多 种 来 源 转变 ， 近 年 来 对 公共 
标准 和 免费 开放 资源 的 信赖 已 经 与 日 俱 增 。 

UNIX 作 为 一 种 现象 而 不 单 是 商标 品牌 ， 有 幸 能 与 时 俱 进 ， 乃 至 领导 潮流 。 在 20 世 纪 
70~80 年 代 ，AT&T 虽 对 UNIX 的 实际 源 代码 进行 了 版 权 保 护 ， 但 却 鼓励 在 系统 的 接口 和 语言 
基础 上 进行 标准 化 的 工作 。 例 如 ，AT&T 发 布 了 SVID (System V Interface Definition, AZEV 
接口 定义 )， 这 成 为 POSIX 及 其 后 续 工 作 的 基础 。 后 来 ，UNIX 可 以 说 相当 优雅 地 适应 了 网 络 
环境 ， 虽 不 那么 轻巧 却 也 充分 地 适应 了 图 形 环境 。 再 往 后 ， 开 源 运 动 的 技术 基础 中 集成 了 
UNIX 的 基本 内 核 接口 和 许多 它 独 特 的 用 户 级 工具 。 

即使 在 UNIX 软 件 系 统 本 身 还 是 专 有 的 时 候 ， 鼓 励 出 版 UNIX 系 统 方面 的 论文 和 书籍 也 是 
至 关 重 要 的 ， 著 名 的 例子 就 是 Maurice Bach 的 《UNIX 操 作 系 统 设计 》 一 书 。 其 实 我 要 说 明 的 
是 ，UNIX 长 寿 的 主要 原因 是 ， 它 吸引 了 极 具 天 分 的 技术 作者 ， 为 大 众 解 读 它 的 优美 和 神秘 所 
在 。Brian Kernighan 是 其 中 之 一 ，Rich Stevens 自 然 也 是 。 本 书 第 1 版 连同 Stevens 所 著 的 系列 
网 络 技术 书籍 ， 被 公认 为 优秀 的 、 匠 心 独 有 具 的 名 著 ， 成 为 极其 和 畅销 的 作品 。 

然而 ， 本 书 第 1 版 毕竟 出 版 时 间 太 早 了 ， 那 时 还 没有 出 现 Linux ， 源 自 伯克利 CSRG 的 
UNIX 接 口 的 开源 版 本 还 没有 广 为 流 行 ， 很 多 人 的 网 络 还 在 用 串 行 调 制 解 调 器 。Steve Rago 认 
真 仔细 地 更 新 了 本 书 ， 以 反映 所 有 这 些 技 术 进 展 ， 同 时 还 考虑 到 各 种 ISO 标准 和 IEEE 标 准 这 
些 年 来 的 变化 。 因 此 ， 他 的 例子 是 最 新 的 ， 也 是 最 新 测试 过 的 。 

总 之 ， 这 是 一 本 弥 足 珍贵 的 经 典 著作 的 更 新 版 。 


Dennis Ritchie 
2005 年 3 月 于 新 泽 西 州 Murray Hill 
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引言 

我 与 Rich Stevens 最 早 是 通过 电子 邮件 开始 交往 的 ， 当 时 我 发 邮件 报告 他 的 第 一 本 书 
《UNIX 网 络 编程 》 的 一 个 排版 错误 。 他 回信 开玩笑 说 我 是 第 一 个 给 他 发 这 本 书 勘 误 的 人 。 到 
他 1999 年 故去 之 前 ， 我 们 时 不 时 地 会 通 些 邮件 ， 一 般 都 是 在 有 了 问题 认为 对 方 能 解答 的 时 候 。 
我 们 在 USENIX 会 议 期 间 多 次 相 见 ， 并 共 进 晚餐 ，Rich 在 会 议 中 给 大 家 做 技术 培训 。 

Rich Stevens 真 是 个 益友 , 行为 举止 很 有 绅士 风度 。 我 在 1993 年 写 《UNIX 系 统 V 网 络 编程 》 
时 ， 试 图 把 书写 成 他 的 《UNIX 网 络 编程 》 的 系统 V 版 。Rich 发 自 内 心地 高 兴 地 为 我 审阅 了 好 
” 儿 章 ， 并 不 把 我 当成 竞争 对 手 ， 而 是 当 作 一 起 写 书 的 同事 。 我 们 曾 多 次 谈 到 要 合作 给 他 的 
《TCP/IP 详 解 》 写 个 STREAMS 版 。 天 车 有 情 ， 我 们 或 许 已 经 完成 了 这 个 心愿 。 然 而 ，Rich 已 
经 驾 堆 西 去 ， 修 订 《UNIX 环 境 高 级 编程 》 就 成 为 我 跟 他 一 起 写 书 的 最 易 实现 的 方式 。 

当 Addison-Wesley 公 司 的 编辑 找到 我 说 想 修订 Rich 的 这 本 书 时 ， 我 第 一 反应 是 这 本 书 没有 
多 少 要 改 的 。 尽 管 13 年 过 去 了 ，Rich 的 书 还 是 巍然 屹立 。 但 是 ， 与 当初 本 书 出 版 的 时 候 相 比 ， 
今日 的 UNIX 行 业已 经 有 了 巨大 的 变化 。 

。 系统 V 的 各 个 变种 渐渐 被 Linux 所 取代 。 原 来 生产 硬件 配 以 各 自 的 UNIX 版 本 的 几 个 主要 
厂商 ， 要 么 提供 了 Linux 的 移植 版 本 ， 要 么 宜 布 支持 Linux。Solaris 可 能 算是 硕果 仅 存 的 
占有 一 定 市 场 份额 的 UNIX 系 统 V 版 本 4 的 后 商 了 。 

e 加 州 大 学 伯克利 分 校 的 CSRG (计算 机 科学 研究 组 ) 在 发 布 了 4.4BSD 之 后 ， 已 经 决定 不 
再 开发 UNIX 操 作 系统 ， 只 有 几 个 志愿 者 小 组 还 维护 着 一 些 可 公开 获得 的 版 本 。 

。 Linux 受 到 数 以 千 计 的 志愿 者 的 支持 ， 它 的 引入 使 任何 一 个 拥有 计算 机 的 人 都 能 运行 类 
似 于 UNIX 系 统 的 操作 系统 ， 并 且 可 以 免费 获得 源 代码 支持 哪怕 最 新 的 硬件 设备 。 在 已 
经 存在 几 种 免费 BSD 版 本 的 情况 下 ，Linux 的 成 功 确实 是 个 奇迹 。 

e 苹果 公司 作为 一 个 富有 创新 精神 的 公司 ， 已 经 放弃 了 老 的 Mac 操 作 系统 ， 换 之 以 一 个 在 
Mach 和 FreeBSD 基 础 上 开发 的 新 系统 。 

因此 ,我 已 经 努力 更 新 本 书 中 的 内 容 ， 以 反映 这 四 种 平台 。 

在 Rich 1992 年 出 版 《UNIX 环 境 高 级 编程 》 之 后 ， 我 扔 掉 了 手头 几乎 所 有 的 UNIX 程 序 员 
手册 。 这 些 年 来 ， 我 桌 上 最 常 摆 放 的 就 是 两 本 书 ， 一 本 是 字典 ， 另 一 本 就 是 《UNIX 环 境 高 级 
编程 》。 我 希望 读者 也 能 认为 本 修订 版 一 样 有 用 。 


对 第 1 版 的 改动 


Rich 的 书 依然 屹立 ， 我 试图 不 去 改动 他 这 本 书 原来 的 风格 。 但 是 13 年 间 世 事 兴 训 ， 尤 其 是 
影响 UNIX 编 程 接口 的 有 关 标 准 变化 很 大 。 
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我 依据 标准 化 组 织 的 标准 ， 更 新 了 全 书 相关 的 接口 方面 的 内 容 。 第 2 章 改 动 较 大 ， 因 为 它 
主要 是 讨论 标准 的 。 本 书 第 1 版 是 根据 POSIX.1 标 准 的 1990 年 版 写 的 ， 本 修订 版 依据 2001 年 版 
的 新 标准 ， 内 容 要 丰富 很 多 。1990 年 ISO 的 C 标 准 在 1999 年 也 更 新 了 ， 有 些 改动 影响 到 
POSIX.1 标 准 中 的 接口 。 

目前 的 POSIX.1 规 范 涵盖 了 更 多 的 接口 。The Open Group ( 原 称 X/Open) 发 布 的 “Single 
UNIX Specification” 的 基本 规范 现在 已 经 并 入 POSIX.1， 后 者 包含 了 几 个 1003.1 标 准 和 另外 几 
个 标准 草案 ， 原 来 这 些 标准 是 分 开 出 版 的 。 

我 也 相应 地 增加 了 些 章节 讨论 新 主题 。 线 程 和 多 线程 编程 是 相当 重要 的 概念 ， 因 为 它们 为 
程序 员 处 理 并 发 和 异步 提供 了 更 清晰 的 方式 。 

套 接 字 接 口 现在 也 是 POSIX.1 的 一 部 分 了 。 它 为 进程 间 通 信 (IPC) 提供 了 单一 的 接口 ， 
而 不 考虑 进程 的 位 置 。 它 成 为 IPC 章 节 的 自然 扩展 。 

我 省 略 了 POSIX.1 中 的 大 部 分 实时 接口 。 这 些 内 容 最 好 是 在 一 本 专门 讲述 实时 编程 的 书 中 
介绍 。 参 考 文献 里 有 一 本 这 方面 的 书 。 

我 把 最 后 面 几 章 的 案例 研究 也 更 新 了 ， 用 了 更 接近 现实 的 例子 。 例 如 ， 现 在 很 少 有 系统 通 
过 串口 或 并 口 连接 PostScript 打 印 机 了 ， 多 数 PostScript 打 印 机 是 通过 网 络 连接 的 ， 所 以 我 对 
PostScript 打 印 机 通信 的 例子 做 了 修改 。 

有 关 调 制 解 调 器 通信 的 那 一 章 如 今 已 经 不 太 适 用 了 。 原 始 材料 我 们 保留 在 本 书 网 站 上 ， 有 
两 种 格式 ， PostScript (http://www.apuebook.com/lostchapter/modem.ps) 和 PDF (http://www. 
apuebook.com/lostchapter/modem.pdf) , 

书 中 实例 的 源 代码 也 可 以 从 www.apuebook.com 上 获得 。 多 数 实例 已 经 在 下 述 四 种 平台 上 
运行 过 ， 

(1) FreeBSD 5.2.1， 这 是 加 州 大 学 伯克利 分 校 CSRG 的 4.4BSD 的 一 个 变种 ， 在 英特尔 奔腾 
处 理 器 上 运行 。 

(2) Linux 2.4.22 (Mandrake 9.2 发 布 )， 是 一 个 免费 的 类 UNIX 操 作 系 统 ， 运 行 于 英特尔 奔 
腾 处 理 器 上 。 

(3) Solaris 9， 是 Sun 公 司 系统 V 版 本 4 的 变种 ， 运 行 于 64 位 的 UltraSPARC Ifi 处 理 器 上 。 

(4) Darwin 7.4.0， 是 基于 FreeBSD 和 Mach 的 操作 系统 环境 ， 也 是 Apple Mac OS X 10.3 版 
本 的 核心 ， 运 行 于 PowerPC 处 理 器 上 。 


致谢 


(首先 要 感谢 ) Rich Stevens 独 立 创作 了 本 书 第 1 版 ， 它 立即 成 为 一 本 经 典 著作 。 

没有 家 人 的 支持 ， 我 不 可 能 修订 此 书 。 他 们 容忍 我 满 屋子 散落 稿 纸 〈 比 平常 还 甚 ) BA 
了 家 里 的 好 几 台 机 器 ， 成 天 埋头 于 电脑 屏幕 前 。 我 的 妻子 Jeanne 甚 至 亲自 动手 帮 有 我 在 一 台 测 
试 的 机 器 上 安装 了 Linux。 

多 名 技术 审 校 者 提出 了 很 多 改进 意见 ， 确 保 内 容 准确 。 我 非常 感谢 Pavid Bausum, David 
Boreham, Keith Bostic. Mark Ellis, Phil Howard, Andrew Josey, Mukesh Kacker, Brian 
Kernighan, Bengt Kleberg, Ben Kuperman, Eric Raymond 和 Andy Rudoff, 

我 还 要 谢谢 Andy Rudoff 给 我 解答 有 关 Solaris 的 问题 ， 谢 谢 Dennis Ritchie te {EM [REA dc 
纸 堆 中 为 我 寻找 有 关 历 史 方 面 问题 的 答案 。 再 次 谢谢 Addison-Wesley 公 司 的 员工 ， 与 他 们 合 
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第 1 版 前 言 


引言 

本 书 描述 了 UNIX 系 统 的 程序 设计 接口 一 系统 调用 接口 和 标准 C 库 提供 的 很 多 函数 。 本 
书 针对 的 是 所 有 的 程序 员 。 

与 大 多 数 操作 系统 一 样 ，UNIX 为 程序 运行 提供 了 大 量 的 服务 一 一 打开 文件 ， 读 文件 ， 启 
动 一 个 新 程序 ， 分 配 存储 区 以 及 获得 当前 时 间 等 。 这 些 服 务 被 称 为 系统 调用 接口 (system call 
interface) 。 另 外 ， 标 准 C 库 提供 了 大 量 广泛 用 于 C 程 序 中 的 函数 (格式 化 输出 变量 的 值 ， 比 较 
两 个 字符 串 等 ) 。 

系统 调用 接口 和 库 函 数 可 参见 《UNIX 程 序 员 手 册 》 第 2、3 部 分 。 本 书 不 是 这 些 内 容 的 重 
复 。 手 册 中 没有 给 出 实例 及 基本 原理 ， 而 这 些 则 正 是 本 书 所 要 讲述 的 内 容 。 


UNIX 标 准 


20 世 纪 80 年 代 出 现 了 各 种 版 本 的 UNIX，20 世 纪 80 年 代 后 期 在 此 基础 上 制定 了 数 个 国际 标 
准 ， 包 括 C 程 序 设计 语言 的 ANSI 标 准 、IEEE POSIX 标 准 系列 (还 在 制定 中 )、X/Open 可 移植 
性 指南 。 

本 书 也 介绍 了 这 些 标准 ， 但 是 并 不 只 是 说 明 标准 本 身 ， 而 是 着 重 说 明 它 们 与 应 用 广泛 的 
一 些 实现 (主要 指 SVR4 以 及 即将 发 布 的 4.4BSD) 之 间 的 关系 。 这 是 一 种 贴近 现实 世界 的 描述 ， 
而 这 正 是 标准 本 身 以 及 仅 描 述 标 准 的 文献 所 缺少 的 。 


本 书 的 组 织 


本 书 分 为 6 个 部 分 : 

(1) 对 UNIX 程 序 设 计 基 本 概念 和 术语 的 简要 描述 (第 1 章 )， 以 及 对 各 种 UNIX 标 准 化 工作 
和 不 同 UNIX 实 现 的 讨论 (第 2 章 )。 

(2) 7O 一 一 不 带 缓 冲 的 IO (第 3 章 )、 文 件 和 目录 (第 4 章 )、 标 准 WO 库 (SR) 和 标准 
系统 数据 文件 (第 6 章 )。 

(3) 进程 一 -UNIX 进程 的 环境 (第 7 章 )、 进 程控 制 (第 8 章 )、 进 程 之 间 的 关系 (第 9 章 ) 
和 信号 (第 10 章 )。 

(4) 更 多 的 /0 一 一 终端 I/O (第 11 章 )、 高 级 MO (第 12 章 ) 和 守护 进程 (第 13 章 )。 

(5) IPC 一 一 进程 间 通信 (第 14 和 15 章 )。 

(6) 实例 一 一 一 个 数据 库 的 函数 库 (第 16 章 )、 与 PostScript 打印 机 的 通信 (第 17 章 )、 调 制 
解 调 器 拨号 程序 (第 18 章 ) 和 使 用 伪 终端 (第 19 章 )。 

如 果 对 C 语 言 较 熟 悉 并 具有 某 些 应 用 UNIX 的 经 验 ， 对 学 习 本 书 将 非常 有 益 ， 但 是 并 不 要 
求 读 者 必须 具有 UNIX 编 程 经 验 。 本 书面 向 的 读者 主要 是 : 熟悉 UNIX 的 程序 员 和 熟悉 其 他 某 
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个 操作 系统 且 希 望 了 解 大 多 数 UNIX 系 统 提供 的 各 种 服务 细节 的 程序 员 。 
本 书 中 的 实例 


本 书包 含 了 大 量 实例 一 一 大 约 10 000 行 源 代码 。 所 有 实例 都 用 ANSI C 语 言 编 写 。 在 阅读 
本 书 时 ， 建 议 准备 一 本 你 所 使 用 的 UNIX 系 统 的 《UNIX 程 序 员 手册 》， 在 细节 方面 有 时 需要 参 
考 该 手册 。 

几乎 对 于 每 一 个 函数 和 系统 调用 ， 本 书 都 用 一 个 小 的 完整 的 程序 进行 了 演示 。 这 可 以 让 
读者 清楚 地 了 解 它们 的 用 法 ， 包括 参数 和 返回 值 等 。 有 些小 程序 还 不 足以 说 明 库 函数 和 系统 
调用 的 复杂 功能 和 应 用 技巧 ， 所 以 书 中 还 包含 了 一 些 较 大 的 实例 ( 见 第 16~19 章 )。 

所 有 实例 的 源 代 码 文件 都 可 在 因特网 上 用 匿名 ftp 从 因特网 主机 Etp.uu.net 的 
published/books/stevens.advprog.tar.2 文 件 下 载 。 读 者 可 以 在 自己 的 机 器 上 修改 
并 运行 这 些 源 代码 。 

用 于 测试 实例 的 系统 


不 幸 的 是 ， 所 有 的 操作 系统 都 在 不 断 变更 ，UNIX 也 不 例外 。 下 图 给 出 了 系统 V 和 4.xBSD 
最 近 的 进展 情况 。 











4.3+BSD 
4.3BSD 4.3BSD Tahoe 4.3BSD Reno 44BSD ? 
| | BSD Net 1 | BSD Net 2 | 
I — 1986 — i987 — - — i988 i 1989 h 两 IU 95i 一 
[] ] 
4 I l i t 
SVR3.0 SVR3.1 SVR32 | | O SVR4 | 
XPG3 ANSIC POSIX.1 


4.xBSD 是 由 加 州 大 学 伯克利 分 校 CSRG 开 发 的 。 该 小 组 还 发 布 了 BSD Netl 和 BSD Net2 版 ， 
其 公开 的 源 代 码 源 自 4.xBSD 系 统 。SVRx 表示 AT&T 的 系统 V 第 x 版 。XPG3 指 X/Open 可 移植 性 
指南 的 第 3 个 发 行 版 。ANSI C 是 C 语 言 的 ANSI 标 准 。POSIX.1 是 IEEE 和 ISO 的 类 UNIX 系 统 接 
口 标准 。2.2 节 和 2.3 节 将 对 这 些 标准 和 不 同 版 本 之 间 的 差别 做 更 多 的 说 明 。 


本 书 中 用 4.3+BSD 替 示 源 自 伯 克利 的 介 于 BSD Noti ACRE OCR 


的 名 字 来 引 用 该 条 &. OU RA. 34BSD, 


本 书 中 的 大 多 数 实例 曾 在 下 面 4 种 UNIX 系 统 上 运行 过 ， 

(1) U.HZ 4] (UHC) 的 UNIX 系 统 V/386 R4.0.2 (vanilla SVR4)， 运 行 于 Intel 80386 处 理 
器 上 。 

(2) 加 州 大 学 伯克利 分 校 CSRG 的 4.3+BSD， 运 行 于 惠普 工作 站 上 。 

(3) 伯克利 软件 设计 公司 的 BSD/386 (是 BSD Net2 的 变种 )， 运 行 于 Intel 80386 处 理 器 上 。 
该 系统 与 4.3+BSD 几 乎 相同 。 

(4) Sun 公 司 的 SunOS 4.1.1 和 4.1.2 (该 系统 与 伯克利 系统 有 很 深 的 渊源 ， 但 也 包含 了 许多 
系统 V 的 特性 ) ， 运 行 于 SPARCstation SLC E, 
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本 书 还 提供 了 许多 时 间 测试 及 用 于 测试 的 实际 系统 。 
致谢 


在 过 去 的 一 年 半 中 ， 家 人 给 予 了 我 大 力 支持 和 爱 ， 因 为 写 书 我 们 失去 了 很 多 快乐 的 周末 ， 
我 深 感 菊 次。 写 书 从 许多 方面 影响 了 整个 家 庭 。 谢 谢 Sally、Bill、Ellen 和 David，。 

我 要 特别 感谢 Brian Kernighan 对 我 写作 此 书 的 帮助 。 他 审阅 了 全 部 书稿 ， 不 但 提出 了 大 
量 有 洞察 力 的 技术 意见 ， 还 委婉 地 指出 了 多 处 修辞 问题 ， 但 愿 我 能 够 在 最 终 成 稿 中 已 经 加 以 
体现 。Steve Rago 也 成 为 了 我 的 创作 源泉 ， 不 但 审阅 了 全 部 书稿 ， 还 为 我 解答 了 有 关系 统 V 的 
许多 技术 细节 和 历史 回 题 。 还 要 感谢 Addison-Wesley 公 司 邀 请 的 其 他 技术 审 校 者， 他 们 对 书 
稿 的 各 个 部 分 提出 了 很 有 价值 的 意见 ， 他 们 是 Maury Bach、Mark Ellis、Jeff Gitlin、Peter 
Honeyman, John Linderman, Doug Mcllroy, Evi Nemeth, Craig Partridge, Dave Presotto, 
Gary Wilson, Gary Wright, 

(感谢 ) 加 州 大 学 伯克利 分 校 CSRG 的 Keith Bostic 和 Kirk McKusick 给 了 我 一 个 账号 ， 可 在 最 
新 的 BSD 系 统 上 测试 书 中 实例 。( 也 要 感谢 Peter Salus) UHC 的 Sam Nataros 和 Joachim Sacksen 给 
我 提供 了 一 份 SVR4， 用 来 测试 书 中 例子 。Trent Hein 则 帮助 我 获得 BSD/386 的 alpha 和 beta 版 。 

其 他 朋友 在 过 去 这 些 年 以 各 种 方式 提供 了 帮助 ， 看 似 不 大 ， 却 非常 重要 。 他 们 是 Paul 
Lucchina, Joe Godsil, Jim Hogue, Ed Tankus 和 Gary Wright。 本 书 的 编辑 是 Addison-Wesley 
公司 的 John Wait， 他 自始至终 是 我 的 忠实 朋友 。 我 不 断 地 延期 交 稿 ， 写 作 篇 幅 也 一 再 超过 计 
划 ， 他 从 不 抱 忽 。 特 别 还 要 感谢 美国 国家 光学 天 文 台 (NOAO ) ， 尤 其 是 Sidney Wolff, 
Richard Wolff 和 Steve Grandi， 为 我 提供 准确 的 计算 机 时 间 。 

真正 的 UNIX 书 应 该 用 troff 写 成 ， 本 书 也 遵循 了 这 一 优秀 传统 。 最 终 清 样 是 作者 用 James 
Clark 写 的 groff 软 件 包 做 出 的 。 非 常 感谢 James Clark 提 供 了 这 个 优异 的 写作 软件 ， 并 迅速 地 修 
正 其 中 所 发 现 的 bug。 也 许 有 一 天 我 会 最 终 弄 清楚 troff 软 件 做 页 脚 的 技巧 。 

我 十 分 欢迎 读者 发 来 电子 邮件 ， 发 表 评 论 ， 提 出 建议 ， 订 正 错误 。 


W.Richard Stevens 
rstevens @kohala.com 
http://www.kohala.com/^rstevens 


1992 年 4 月 于 亚利桑那 州 塔 克 森 市 
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B X 
UNIX 基 础 知识 





1.1 引言 


所 有 操作 系统 都 需要 向 它们 运行 的 程序 提供 各 种 服务 。 通 常 这 些 服务 包括 执行 新 程序 、 打 
开 文件 、 读 文件 、 分 配 存储 区 以 及 获得 当前 时 间 等 。 本 书 集中 盖 述 UNIX 操 作 系统 各 种 版 本 所 
提供 的 服务 。 

想 要 按 严格 的 先后 顺序 介绍 UNIX， 而 不 超前 引用 尚未 介绍 过 的 术语 ， 这 几乎 是 不 可 能 的 
(而 且 也 会 令 人 厌烦 )。 本 章 从 程序 设计 人 员 角 度 快速 浏览 UINIX， 对 书 中 引用 的 一 些 术 语 和 概 
念 进行 简要 的 说 明 并 给 出 实例 。 在 以 后 各 章 中 ， 再 对 这 些 概念 作 更 详细 的 说 明 。 本 章 也 为 不 熟 
悉 UNIX 的 程序 设计 人 员 简 要 介绍 UNIX 提 供 的 各 种 服务 。 


1.2 UNIX 体 系 结构 


在 严格 意义 上 ， 可 将 操作 系统 定义 为 一 种 软件 ， 它 控制 计算 机 硬件 资源 ， 提 供 程 序 运 行 环 
境 。 一 般 而 言 ， 我 们 称 此 种 软件 为 内 核 (kernel) ， 它 相对 较 小 ， 位 于 环境 的 中 心 。 图 1-1 显 示 
了 UNIX 的 体系 结构 。 
阴影 部 分 )。 公 用 气 数 库 构 建 在 系统 调用 接口 之 上 ， 应 用 
软件 既 可 使 用 公用 也 数 库 ， 也 可 使 用 系统 调用 。( 我 们 将 
在 1.11 节 对 系统 调用 和 库 函 数 作 更 多 说 明 。) shell 是 一 种 特 
殊 的 应 用 程序 ， 它 为 运行 其 他 应 用 程序 提供 了 一 个 接口 。 

在 广义 上 ,操作 系统 包括 了 内 核 和 一 些 其 他 软件 ， 这 
些 软件 使 得 计算 机 能 够 发 挥 作用 ， 并 给 予 计 算 机 以 独 有 的 
特性 。 这 些 软件 包括 系统 实用 程序 (system utilities)、 应 
用 软件 、shell 以 及 公用 函数 库 等 。 图 1-1 UNIX 操 作 系统 的 体系 结构 

例如 ，Linux 是 GNU 操 作 系 统 使 用 的 内 核 。 某 些 人 将 此 种 操作 系统 称 为 GNU/Linux， 但 是 ， 
更 通常 的 是 将 其 简称 为 Linux。 虽 然 在 严格 意义 上 ， 这 种 表达 方法 并 不 正确 ， 但 是 因为 “操作 
系统 ”本 身 具 有 双重 含义， 这 还 是 可 以 理解 的 。( 当 然 ， 名 字 简 洁 也 是 个 优点 。) 


1.3 登录 


1. 登录 名 
用 户 在 登录 UNIX 系 统 时 ， 先 键入 登录 名 ， 然 后 键入 口令 。 系 统 在 其 口令 文件 (通常 是 
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/etc/passwd 文 件 ) 中 查看 登录 名 。 口 令 文件 中 的 登录 项 由 7 个 以 冒号 分 隔 的 字段 组 成 ， 它 们 
E: 登录 名 、 加 窗口 令 、 数 值 用 户 ID (205)、 数 值 组 ID (105)、 注 释 字 段 、 起 始 目录 
(/home/sar) 以 及 shell 程 序 (/bin/ksh), 

8ar:x:205:105:Stephen Rago:/home/sar:/bin/ksh 

目前 所 有 的 系统 已 将 加 窗口 令 移 到 另 一 个 文件 中 。 第 6 章 将 说 明 这 种 文件 以 及 访问 它们 的 

2. shell 

用 户 登 录 后 ， 系 统 通常 先 显示 一 些 系 统 信息 ， 然 后 用 户 就 可 以 向 shell 程 序 键入 命令 。( 当 
用 户 登 录 时 ， 某 些 系 统 会 启动 一 个 视窗 管理 程序 ， 但 最 终 总 会 有 一 个 shell 程 序 运行 在 一 个 视窗 
中 。) shell 是 一 个 命令 行 解释 器 ， 它 读 取 用 户 输入 ， 然 后 执行 命令 。 用 户 通常 用 终端 (交互 式 
shell) ， 有 时 则 通过 文件 ( 称 为 shel1 脚 本 ，shell script) 向 shell 进 行 输入 。 表 1-1 中 总 结 了 常见 
的 shell。 


表 1-1 UNIX 系 统 常见 shell 


Bourne shell /bin/sh 链接 至 bash 
Bourne-again shell /bin/bash Ay ERY . 


C shell /bin/csh 链接 至 tcsh 链接 至 tcsh 链接 至 tcsh 
Korn shell /bin/ksh 
TENEX C shell /bin/tcsh 





系统 从 口令 文件 中 相应 用 户 登 录 项 的 最 后 一 个 字段 中 了 解 到 应 该 为 该 登录 用 户 执行 哪 一 个 
shell, 

自 V7 以 来 ， 由 Steve Bourne 在 贝尔 实验 室 开发 的 Bourne shell 得 到 了 广泛 应 用 ， 几 平 每 一 个 
现 有 的 UNIX 系 统 都 提供 Bourne shell， 其 控制 流 结构 类 似 于 Algol 68。 

C shell 是 由 Bill Joy 在 伯克利 开发 的 ， 所 有 BSD 版 本 都 提供 这 种 shell。 另 外 ，AT&T 的 系统 
V/386 R3.2 和 SVR4 也 提供 C shell (下 一 章 将 对 这 些 不 同 的 UNIX 版 本 作 更 多 说 明 )。C shell 是 在 
第 六 版 shell 而 非 Bourne shell 的 基础 上 构造 的 。 其 控制 流 类 似 于 C 语 言 ， 它 支持 Bourne shell 没 有 
的 某 些 特色 功能 ， 例 如 作业 控制 、 历 史记 忆 机 制 以 及 命令 行 编辑 等 。 

Korn shell 是 Bourne shell 的 后 继 者 ， 它 首先 在 SVR4 中 提供 。Korn shell 是 由 David Korn 在 贝 
尔 实 验 室 研发 的 ， 并 在 大 多 数 UNIX 系 统 上 运行 ， 但 在 SVR4 之 前 通常 它 需 要 另行 购买 ， 所 以 没 
有 其 他 两 种 shell 流 行 。 它 与 Bourne shell 向 上 兼容 ， 并 具有 使 C shell 广 泛 得 到 应 用 的 一 些 特色 功 
能 ， 包 括 作 业 控 制 以 及 命令 行 编辑 等 。 

Bourne-again shell GNU shell, 所 有 Linux 系 统 都 提供 这 种 shell。 它 被 设计 成 遵循 POSIX 的 ， 
同时 也 保留 了 与 Bourne shell 的 兼容 性 。 它 支持 C shell 和 Korn shell 两 者 的 特色 功能 。 

TENEX C shell 是 C shell 的 加 强 版 本 。 它 从 TENEX 操作 系统 借鉴 了 很 多 特色 ， 例 如 命令 完 
备 。(TENEX 操 作 系统 是 1972 年 BBN 公 司 开 发 的 .) TENEX C shell 在 C shell 的 基础 上 增加 了 很 
多 特征 ， 常 被 用 来 替换 C shell, 


Linux 的 默认 shell 是 Bourne-again shell, ¥% F, /bin/sh4f&&4£ £|/bin/bash, FreeBSD4eMac 
OS X 的 默认 用 户 shell 是 TENEX C shell， 但 是 因为 使 用 C shell 编 程 语言 极其 困难 ， 所 以 它们 使 用 Bourne 
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shell 编写 用 于 管理 方面 的 shell 脚 本 。Solaris 继 承 了 BSD 和 系统 V 两 者 , 它 提供 了 表 1-1 中 所 示 的 所 有 shell。 
在 因特网 上 可 以 找到 大 多 数 shell 的 自由 软件 移植 版 。 

本 书 将 使 用 加 灰 底 形式 的 注释 来 描述 历史 ， 并 对 不 同 的 UNIX 实 现 进行 比较 。 当 我 们 了 解 到 历史 
综 由 后 ,会 更 好 地 理解 采用 某 种 特定 实现 技术 的 原因 。 


本 书 将 使 用 很 多 交互 shell 实 例 来 执行 所 开发 的 程序 ， 其 中 将 应 用 Bourne shell、Korn shell 和 
Bourne-again shell 三 者 都 具有 的 功能 。 


1.4 文件 和 目录 


1. 文件 系统 

UNIX 文 件 系统 是 目录 和 文件 组 成 的 一 种 层次 结构 ， 目 录 的 起 点 称 为 根 (root), HAF 
一 个 字符 /。 目 录 (directory) 是 一 个 包含 许多 目录 项 的 文件 ， 在 逻辑 上 ， 可 以 认为 每 个 目录 项 
都 包含 一 个 文件 名 ， 同 时 还 包含 说 明 该 文件 属性 的 信息 。 文 件 属 性 是 指 文件 类 型 〈 是 普通 文件 
还 是 目录 )、 文 件 大 小 、 文 件 所 有 者 、 文 件 权限 〈 其 他 用 户 能 否 访问 该 文件 ) 以 及 文件 最 后 的 
修改 时 间 等 。stat 和 fstat 函 数 返 回 包 含 所 有 文件 属性 的 一 个 信息 结构 。 第 4 章 将 详细 说 明文 
件 的 各 种 属性 。 


目录 项 的 还 辑 视 图 与 实际 奉 放 在 磁盘 上 的 方式 是 不 同 的 。UNIX 文 件 系统 的 大 多 数 实现 并 不 在 目 
录 项 中 厅 放 属性 ， 这 是 因为 当 一 个 文件 具有 多 个 醒 链 接 时 ， 很 难保 持 多 个 属性 副本 之 间 的 同市 。 到 第 4 
章 讨 论 硬 链接 时 ， 这 个 问题 将 很 好 理解 。 


2. 文件 名 

目录 中 的 各 个 名 字 称 为 文件 名 (filename)。 不 能 出 现在 文件 名 中 的 字符 只 有 和 斜 线 (/) 和 空 操 
作 符 (null) 两 个 。 斜 线 用 来 分 隔 构成 路 径 名 〈 在 下 面 说 明 ) 的 各 文件 名 ， 空 操作 符 则 用 来 终 
止 一 个 路 径 名 。 尽 管 如 此 ， 好 的 习惯 是 只 使 用 印刷 字符 的 一 个 子 集 作为 文件 名 字符 。 其 理由 是 ， 
如 果 在 文件 名 中 使 用 了 某 些 shell 特 殊 字符 ， 则 必须 使 用 shell 的 引号 机 制 来 引用 文件 名 ， 这 会 带 
来 很 多 麻烦 。 

创建 新 目录 时 会 自动 创建 两 个 文件 名 : . ( 称 为 点 ) 和 .. ( 称 为 点 一 点 )。 点 指 当前 目录 ， 点 一点 
则 指 父 目录 。 在 最 高 层次 的 根 目录 中 ， 点 一 点 与 点 相同 。 

Research UNIX System 和 某 些 早期 UNIX 系 统 V 的 文件 系统 限制 文件 名 的 最 大 长 度 为 14 个 字 
符 ，BSD 版 本 则 将 这 种 限制 扩大 到 255 个 字符 。 现 今 ， 几 乎 所 有 商品 化 的 UNIX 系 统 都 支持 至 少 
为 255 个 字符 的 文件 名 。 

3. 路 径 名 

一 个 或 多 个 以 斜 线 分 隔 的 文件 名 序列 〈 也 可 以 斜 线 开头 ) 构成 路 径 名 (pathname)， 以 斜 
线 开 头 的 路 径 名 称 为 绝对 路 径 名 (absolute pathname), 否则 称 为 相对 路 径 名 (relative pathname) , 
相对 路 经 名 引用 相对 于 当前 目录 的 文件 。 文 件 系 统 根 的 名 字 (/) 是 一 个 特殊 的 绝对 路 径 名 ， 它 不 
含 文件 名 。 


实例 
不 难 列 出 一 个 目录 中 所 有 文件 的 名 字 ， 程 序 清单 1-1 是 1s(1) 命 令 的 简要 实现 。 
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程序 清单 1-1 列 出 一 个 目录 中 的 所 有 文件 
#include "apue.h" 
#include <dirent.h> 
int 
main(int argc, char *argv[]) 


DIR *dp; 
struct dirent *dirp; 


if (arge != 2) 
err_quit("usage: ls directory name"); 


if ((dp = opendir(argv[1])) == NULL) 
err sysS("can't open $s", argv[1]); 
while ((dirp - readdir(dp)) !- NULL) 


printf ("%$s\n", dirp-»d name); 


closedir (dp); 
exit (0); 


} 


1s(1) 这 种 表示 方法 是 UNIX 系 统 的 惯用 方法 ， 用 以 引用 UNIX 手 册 集 中 的 一 个 特定 项 。 
1s(1) 引 用 第 一 部 分 中 的 1s 项 ， 各 部 分 通常 用 数字 1 至 8 表示 ， 在 每 个 部 分 中 的 各 项 则 按 字母 顺 
序 排 列 。 在 本 书 中 始终 假定 你 有 自己 所 用 的 UNIX 系 统 的 手册 。 


早期 的 UNIX 系 统 把 8 个 部 分 都 集中 在 一 本 《UNIX 程 序 员 手册 》 中 ， 随 着 页 数 的 增加 ， 现 在 的 趋 
势 是 把 这 些 部 分 分 别 安排 在 不 同 的 手册 中 .分 为 用 户 手 册 、 程 序 员 手 册 以 及 系统 管理 员 手 册 等 等。 

某 些 UNIX 系 统 把 某 部 分 的 手册 又 用 大 写字 母 进一步 分 成 若干 小 部 分 ， 例 如 ，AT & T[1990e] 中 的 
所 有 标准 IO 函数 都 被 指明 位 于 3S 部 分 中 ， 例 如 fopen (3S)。 另 一 些 UNIX 系 统 不 用 数字 而 是 用 字母 将 | 
手册 分 成 若干 部 分 ， 例 如 用 C 表 示 命令 部 分 等 等 。 





现今 ， 大 多 数 手 册 都 以 电子 文档 形式 提供 。 如 果 你 用 的 是 联机 手册 ， 则 可 用 下 面 的 命令 查 
看 1s 命 令 手 册页 : 
man 1 ls 


或 


man -sl ls 


程序 清单 1-1 只 打印 一 个 目录 中 各 个 文件 的 名 字 ， 不 显示 其 他 信息 ， 如 若 该 源 文件 名 为 
myls.c， 则 可 以 用 下 面 的 命令 对 其 进行 编译 ， 编 译 结果 送 入 系统 默认 名 为 a. out 的 可 执行 文 
件 中 。 


cc myls.c 


历史 上 ，cc(1) 是 C 编 译 器 。 在 配置 了 GNU C 编 译 系统 的 系统 中 ，C 编 译 器 是 gcc(1)。 其 中 ，cc3 
常 链接 至 gcc。 


样本 输出 如 下 : 


$ ./a.out /dev 


console 
tty 
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mem 
kmem 
null 
mouse 
stdin 
stdout 
stderr 
zero 
此 处 略 去 x x 行 
cdrom 
$ ./a.out /var/spool/cron 
can't open /var/spool/cron: Permission denied 
$ ./a.out /dev/tty 
can't open /dev/tty: Not a directory 


本 书 将 以 这 种 方式 表示 输入 的 命令 及 其 输出 : 输入 的 字符 以 粗 体 表示 ， 程 序 输出 则 以 上 面 


所 示 的 字体 表示 。 如 果 和 欲 对 输出 添加 注释 ， 则 以 中 文 宋体 表示 。 输 入 之 前 的 美元 符号 ($) 是 shell 
打印 的 提示 符 ， 本 书 总 是 将 shell 提 示 符 表示 为 $。 


注意 ，my1s 程 序列 出 的 目录 项 不 是 以 字母 顺序 排列 的 ， 而 1s 命 令 在 打印 目录 项 前 一 般 按 


字母 顺序 将 名 字 排 序 。 


在 这 20 行 的 程序 中 ， 有 很 多 细节 需要 考虑 。 

“首先 ， 其 中 包含 了 一 个 头 文件 apue .h。 本 书 中 几乎 每 一 个 程序 都 包含 此 头 文件 。 它 包含 
了 某 些 标准 系统 头 文件 ， 定 义 了 许多 常量 及 函数 原型 ， 这 些 都 将 用 于 本 书 的 各 个 实例 中 ， 
附录 B 列 出 了 这 一 头 文件 。 

"main 国 数 的 声明 使 用 了 ISO C 标 准 所 使 用 的 风格 (下 一 章 将 对 ISO C 标 准 作 更 多 说 明 ) 。 

* 取 命令 行 的 第 1 个 参数 argv [1 ] 作为 要 列 出 其 各 个 目录 项 的 目录 名 。 第 7 章 将 说 明 main 函 
数 如 何 被 调用 ， 程 序 如 何 存 取 命令 行 参数 和 环境 变量 。 

。 因 为 各 种 不 同 UNIX 系 统 目 录 项 的 实际 格式 是 不 一 样 的 ， 所 以 使 用 函数 opendir.、 
readdir 和 closedir 对 目录 进行 处 理 。 

。opendir 函 数 返 回 指向 DIR 结 构 的 指针 ， 我 们 将 该 指针 传送 给 readdir 函 数 。 我 们 并 不 
关心 DIR 结 构 中 包含 了 什么 。 然 后 ， 在 循环 中 调用 readdir 来 读 每 个 目录 项 。 它 返回 一 
个 指向 dirent 结 构 的 指针 ， 而 当 目 录 中 已 无 目录 项 可 读 时 则 返回 null 指 针 。 在 dirent 
结构 中 取出 的 只 是 每 个 目录 项 的 名 字 (da_name)。 使 用 该 名 字 ， 此 后 就 可 调用 stat 国 数 
( 见 4.2 节 ) 以 获得 该 文件 的 所 有 属性 。 

。 调 用 了 两 个 自 编 的 函数 来 对 错误 进行 处 理 ，err_sys 和 err_quit。 从 上 面 的 输出 中 可 
以 看 到 ，err_sys 函 数 打 印 一 条 消息 (“Permission denied (权限 拒绝 )” 或 “Not a 
directory (不 是 一 个 目录 )”), 说 明 遇 到 了 什么 类 型 的 错误 。 这 两 个 出 错 处 理 函 数 在 附录 
B 中 说 明 ，1.7 节 将 更 多 地 叙述 出 错 处 理 。 

。 当 程序 将 结束 时 ， 它 以 参数 0 调用 函数 exit。 函 数 exit 终 止 程序 。 按 惯例 ， 参 数 0 的 意 
思 是 正常 结束 ， 参 数值 1 ~255 则 表示 出 错 。8.5 节 将 说 明 一 个 程序 (例如 shell 或 我 们 所 编 
写 的 程序 ) 如 何 获 得 它 所 执行 的 另 一 个 程序 的 exit 状 态 。 

4. 工作 目录 

每 个 进程 都 有 一 个 工作 目录 (working directory)， 有 了 时 称 其 为 当前 工作 目录 (current working 


directory)。 所 有 相对 路 径 名 都 从 工作 目录 开始 解释 。 进 程 可 以 用 chdir 函 数 更 改 其 工作 目录 。 





例如 ， 相 对 路 径 名 doc /memo/joe 指 的 是 文件 joe， 它 在 目录 memo 中 ， 而 memo 又 在 目录 
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doc 中 ，dcc 则 应 是 工作 目录 中 的 一 个 目录 项 。 从 该 路 径 名 可 以 看 出 ，doc 和 meme 都 应 当 是 目 
录 ， 但 是 却 不 清楚 joe 是 文件 还 是 目录 。 路 径 名 /urs/1ipb/1int 是 一 个 绝对 路 径 名 ， 它 指 的 是 
文件 (RER) 1int， 而 lint 在 目录 1ipb 中 ，1ib 则 在 目录 usr 中 ， 最 后 ，usr 在 根 目录 中 。 
5. 起 始 目录 
登录 时 ， 工 作 目 录 设置 为 起 始 目 录 (home directory)， 该 起 始 目录 从 口令 文件 ( 见 1.3 节 ) 
中 相应 用 户 的 登录 项 中 取得 。 


1.5 输入 和 输出 


1. 文件 描述 符 

文件 描述 符 (file descriptor) 通常 是 一 个 小 的 非 负 整数 ， 内 核 用 它 标 识 一 个 特定 进程 正在 
访问 的 文件 。 当 内 核 打 开 一 个 已 有 文件 或 创建 一 个 新 文件 时 ， 它 返回 一 个 文件 描述 符 。 在 读 、 
写 文件 时 ， 就 可 使 用 它 。 

2. 标准 输入 、 标 准 输出 和 标准 出 错 

按 惯例 ， 每 当 运 行 一 个 新 程序 时 ， 所 有 的 shell 都 为 其 打开 三 个 文件 描述 符 ， 标准 输入 
(standard input) 、 标 准 输出 (standard output) 以 及 标准 出 错 (standard error) 。 如 果 像 简单 命令 
ls 那样 没有 做 什么 特殊 处 理 ， 则 这 三 个 描述 符 都 链 向 终端 。 大 多 数 shell 都 提供 一 种 方法 ， 使 其 
中 任何 一 个 或 所 有 这 三 个 描述 符 都 能 重新 定向 到 某 个 文件 ， 例 如 ; 


ls > file.list 


执行 ]s 命 令 ， 其 标准 输出 重新 定向 到 名 为 file .1ist 的 文件 上 。 

3. 不 用 缓冲 的 IO 

函数 open、reaGd、write、lseek 以 及 close 提 供 了 不 用 缓冲 的 /JO。 这 些 函 数 都 使 用 文 
件 描 述 符 。 





如 果 愿 意 从 标准 输入 读 ， 并 写 向 标准 输出 ， 则 程序 清单 1-2 中 的 程序 可 用 于 复制 任 一 UNIX 
普通 文件 。 
程序 清单 1-2 将 标准 输入 复制 到 标准 输出 


#include "apue.h" 
#define BUFFSIZE 4096 


int 
main (void) 


int n; 
char buf [BUFFSIZE] ; 


while ((n = read(STDIN FILENO, buf, BUFFSIZE)) > 0) 
if (write (STDOUT_FILENO, buf, n) !- n) 
err Sys("write error"); 
if (n < O0) 
err Sys("read error"); 


exit(0); 
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头 文件 <unistd.h> (apue.h 中 包含 了 此 头 文件 ) 及 两 个 常量 STDIN_FILENO 和 
STDOUT_FILENO 是 POSIX 标 准 的 一 部 分 (下 一 章 将 对 此 作 更 多 的 说 明 )。 该 头 文件 包含 了 很 多 
UNIX 系 统 服 务 的 函数 原型 ， 例 如 程序 清单 1-2 中 调用 的 read 和 write。 

两 个 常量 STDIN_FILENO 和 STDOUT_FILENO 定 义 在 <unistd.h> 头 文件 中 ， 它 们 指定 了 
标准 输入 和 标准 输出 的 文件 描述 符 。 它 们 的 典型 值 分 别 是 0 和 1， 但 是 考虑 到 可 移植 性 ， 我 们 将 
使 用 新 名 字 。 

3.9 节 将 详细 讨论 BUFFSIZE 常 量 ， 说 明 它 的 各 种 不 同 值 将 如 何 影响 程序 的 效率 。 但 是 不 管 
该 常量 的 值 如 何 ， 此 程序 总 能 复制 任 一 UNIX 普 通 文 件 。 

read 函 数 返 回 读 得 的 字 节 数 ， 此 值 用 作 要 写 的 字 节 数 。 当 到 达 文 件 的 尾 端 时 ，read 返 回 0， 
程序 停止 执行 。 如 果 发 生 了 一 个 读 错误 ，read 返 回 -1。 出 错时 大 多 数 系统 函数 返回 一 1。 

如 果 编 译 该 程序 ， 其 结果 送 入 标准 的 a .out 文件 ， 并 以 下 列 方式 执行 它 : 


./a.out > data 


那么 ,标准 输入 是 终端 ， 标 准 输出 则 重新 定向 至 文件 data， 标 准 出 错 也 是 终端 。 如 果 此 输出 
文件 并 不 存在 ， 则 shell 会 创建 它 。 该 程序 将 用 户 键 入 的 各 行 复制 至 标准 输出 ， 键 入 文件 结束 字 
TF (通常 是 Ctrl+D) 时 ， 则 终止 该 次 复制 。 

若 以 下 列 方式 执行 该 程序 : 

./a.out < infile > outfile 


那么 名 为 infile 文 件 的 内 容 复制 到 名 为 cutfile 的 文件 中 。 口 


第 3 章 将 更 详细 地 说 明 不 用 缓冲 的 LO 函数 。 

4. 标准 MO 

标准 VO 函数 提供 一 种 对 不 用 缓冲 WO 函数 的 带 缓冲 的 接口 。 使 用 标准 WO 函数 可 以 无 需 担 心 
如 何 选 取 最 佳 的 缓冲 区 大 小 ， 例 如 程序 清单 1-2 中 的 BUFFSIZE 常 量 的 大 小 。 使 用 标准 WO 函数 
的 另 一 个 优点 是 简化 了 对 输入 行 的 处 理 (常常 发 生 在 UNIX 的 应 用 中 )。 例 如 ，fgets 函 数 读 一 
完整 的 行 ， 而 read 函 数 读 指定 字 节 数 。 在 5.4 节 中 我 们 将 了 解 到 ， 标 准 VO 函 数 库 提供 了 使 我 们 
能 够 控制 该 库 所 使 用 的 缓冲 风格 的 函数 。 

我 们 最 熟悉 的 标准 WO 函数 是 printf。 在 调用 printf 的 程序 中 ， 总 是 包括 <stdio.h> 
(在 本 书 中 ， 该 头 文件 通常 包括 在 apue .h 中 )， 该 头 文件 包括 了 所 有 标准 WO 函数 的 原型 。 


实 5 


程序 清单 1-3 的 功能 类 似 于 调用 reada 和 write 的 前 一 个 程序 ，5.8 节 将 对 此 程序 作 更 详细 的 
说 明 。 它 将 标准 输入 复制 到 标准 输出 ， 于 是 也 就 能 复制 任 一 UNIX 普 通 文 件 。 
程序 清单 1-3 用 标准 MO 将 标准 输入 复制 到 标准 输出 
#include "apue.h" 


int 
main (void) 


int Cc; 
while ((c = getc(stdin)) != EOF) 
if (putc(c, stdout) == EOF) 


err sys("output error"); 
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if (ferror (stdin) ) 
err_sys("input error"); 


exit (0); 


函数 getc 一 次 读 1 个 字符 ， 然 后 函数 putc 将 此 字符 写 到 标准 输出 。 读 到 输入 的 最 后 1 个 字 
节 时 ，getc 返 回 常量 BOP ， 该 常量 在 <stdio.h> 中 定义 。 标 准 输入 /输出 常量 s tain 和 
stdout 也 定义 在 头 文件 <stdio.h> 中 ， 它 们 分 别 表示 标 准 输入 和 标准 输出 文件 。 M 


1.6 程序 和 进程 


1. 程序 

程序 (program) 是 存放 在 磁盘 上 、 处 于 某 个 目录 中 的 一 个 可 执行 文件 。 使 用 6 个 exec 函 数 
中 的 一 个 由 内 核 将 程序 读 入 存储 器 ， 并 使 其 执行 。8.10 节 将 说 明 这 些 exec 函 数 。 

2. 进程 和 进程 ID 

程序 的 执行 实例 被 称 为 进程 【process) 。 本 书 的 每 一 页 几乎 都 会 使 用 这 一 术语 。 某 些 操作 
系统 用 任务 (task) 表示 正 被 执行 的 程序 。 

UNIX 系 统 确保 每 个 进程 都 有 一 个 唯一 的 数字 标识 符 ， 称 为 进程 ID (process ID )。 进 程 ID 
总 是 一 非 负 整数 。 





程序 清单 1-4 用 于 打印 进程 ID。 
程序 清单 1-4 打印 进程 ID 


#include "apue.h" 

int 

main (void) 
printf("hello world from process ID %d\n", getpid()); 
exit (0); 


} 
如 果 编 译 该 程序 ， 并 将 其 结果 送 入 a . out 文件 ， 然 后 执行 它 ， 则 有 : 


$ ./a.out 
hello world from process ID 851 
$ ./a.out 
hello world from process ID 854 


此 程序 运行 时 ， 它 调用 函数 getpia 得 到 其 进程 ID。 E 





3. 进程 控制 
有 三 个 用 于 进程 控制 的 主要 函数 : fork, execfüwaitpid, (execRRAKR EH, IB 
经 常 把 它们 统称 为 exec 函 数 。) 





UNIX 系 统 的 进程 控制 功能 可 以 用 一 个 较 简单 的 程序 ( 见 程序 清单 1-5) 说 明 。 该 程序 从 标 
准 输入 读 命令 ， 然 后 执行 这 些 命令 。 它 是 一 个 类 shell 程 序 的 简化 实现 。 在 这 个 30 行 的 程序 中 ， 
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程序 清单 1-5 ”从 标准 输入 读 命令 并 执行 


#include "apue.h" 
#include «sys/wait.h» 
int 

main (void) 


char buf [MAXLINE] ; /* from apue.h */ 
pid t pid; " 
int | status; 
printf("$$ "); /* print prompt (printf requires %% to print $) */ 
while (fgets(buf, MAXLINE, stdin) !- NULL) ( 
if (buf[strlen(buf) - 1] == ‘\n’) 


buf[strlen(buf) - 1] - 0; /* replace newline with null */ 


if ((pid = fork()) < 0) { 
err_sys ("fork error"); 

} else if (pid == 0) { /* child */ 
execlp (buf, buf, (char *)0); 
err ret("couldn't execute: %s", buf); 
exit(127); 


) 


/* parent */ 

if ((pid = waitpid(pid, &status, 0)) < 0) 
err_sys ("waitpid error"); 

printf("$$ "); 


exit(0); 


) 


。 用 标准 1/0 函 数 fgets 从 标准 输入 一 次 读 一 行 ， 当 键入 文件 结束 字符 (通常 是 Ctrl+D) 作 
为 行 的 第 1 个 字符 时 ，fgets 返 回 一 个 null 指 针 ， 寺 是 循环 终止 ， 进 程 也 就 终 午 。 第 18 章 将 
说 明 所 有 特殊 的 终端 字符 (文件 结束 、 退 格 字 符 、 整 行 擦 除 等 等 )， 以 及 如 何 改 变 它们 。 

。 因 为 fgets 返回 的 每 一 行 都 以 换行 符 终止 ， 后 随 一 个 null 字 节 ， 故 用 标准 C 函 数 strlen 
计算 此 字符 串 的 长 度 ， 然 后 用 一 个 null 字 节 赫 换 换行 符 。 这 样 做 是 因为 execlp 函 数 要 求 
参数 以 null 而 不 是 以 换行 符 结束 。 

。 调 用 fork 创 建 一 个 新 进程 。 新 进程 是 调用 进程 的 复制 品 ， 我 们 称 调用 进程 为 父 进程 ， 新 
创建 的 进程 为 子 进程 。£ork 向 父 进 程 返 回 新 子 进程 的 进程 ID ( 非 负 ) ， 对 子 进程 则 返回 0。 
因为 Eork 创 建 一 新 进程 ， 所 以 说 它 被 调用 一 次 (由 父 进 程 )， 但 返回 两 次 (分 别 在 父 进 
程 及 子 进程 中 )。 

。 在 子 进程 中 ， 调 用 execlp 以 执行 从 标准 输入 读 入 的 命令 。 这 就 用 新 的 程序 文件 替换 了 子 
进程 原先 执行 的 程序 文件 。fork 和 跟随 其 后 的 exec 两 者 的 组 合 是 某 些 操作 系统 所 称 的 
产生 (spawn) 一 个 新 进程 。 在 UNIX 系 统 中 ， 这 两 个 部 分 相互 分 隔 ， 构 成 两 个 函数 。 第 8 
章 将 对 这 些 函 数 作 更 多 说 明 。 

。 子 进程 调用 execlp 执 行 新 程序 文件 ， 而 父 进程 希望 等 待 子 进程 终止 ， 这 一 要 求 由 调用 
waitpid 实 现 ， 其 参数 指定 要 等 待 的 进程 (在 这 里 ，pid 参 数 是 子 进 程 ID)。waitpid 
KAAORE TERRAE IER AS (status 变 量 )。 在 此 简单 程序 中 ， 没 有 使 用 该 值 。 如 果 需 
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要 ， 可 以 用 此 值 准确 地 判定 子 进程 是 因 何 终止 的 。 

。 该 程序 的 最 主要 限制 是 不 能 向 所 执行 的 命令 传递 参数 ， 例 如 不 能 指定 要 列表 的 目录 名 ， 

只 能 对 工作 目录 执行 1s 命 令 。 为 了 传递 参数 ， 先 要 分 析 输 入 行 ， 然 后 用 某 种 约定 把 参数 

分 开 (很 可 能 使 用 空格 或 制 表 符 )， 然 后 将 分 隔 后 的 各 个 参数 传递 给 execlp 函 数 。 尽 管 

如 此 ， 此 程序 仍 可 用 来 说 明 UNIX 系 统 的 进程 控制 功能 。 

如 果 运 行 此 程序 ， 则 得 到 下 列 结果 。 注 意 ， 该 程序 使 用 了 一 个 不 同 的 提示 符 (%)， 以 区 别 
于 shell 的 提示 符 。 


$ ./a.out 

$ date 

Sun Aug 1 03:04:47 EDT 2004 程序 员 挑 灯 夜 战 
% who 

sar :0 Jul 26 22:54 

sar pts/0 Jul 26 22:54 (:0) 
Sar pts/1 Jul 26 22:54 (:0) 
sar pts/2 Jul 26 22:54 (:0) 
% pwd 

/home/sar/bk/apue/2e 

% ls 

Makefile 


% ^D 键入 文件 结束 符 
$ 常规 的 shell 提 示 符 口 





^D 表 示 一 个 控制 字符 。 控 制 字 符 是 特殊 字符 ， 其 形成 方法 是 : 在 键盘 上 按 下 控制 链 一 一 通常 被 标 
记 为 Control 或 Ctr1， 同 时 按 另 一 个 键 。Control-D 或 ^D 是 默认 的 文件 结束 符 。 在 第 18 章 中 讨论 终端 时 、 
会 介绍 更 多 的 控制 字符 。 


4. 线程 和 线程 ID 

通常 ， 一 个 进程 具有 一 个 控制 线程 (thread) ， 同 一 时 刻 只 执行 一 组 机 器 指令 。 对 于 某 些 问 
题 ， 如 果 不 同 部 分 各 使 用 一 个 控制 线程 ， 那 么 整个 问题 解决 起 来 就 容易 得 多 。 另 外 ， 多 个 控制 

[3] 线程 也 能 充分 利用 多 处 理 器 系统 的 并 行 性 。 

在 一 个 进程 内 的 所 有 线程 共享 同一 地 址 空间 、 文 件 描述 符 、 栈 以 及 与 进程 相关 的 属性 。 因 
为 它们 能 访问 同一 存储 区 ， 所 以 各 线程 在 访问 共享 数据 时 需要 采取 同步 措施 以 避免 不 一 致 性 。 

与 进程 相同 ， 线 程 也 用 ID 标识 。 但 是 ， 线 程 ID 只 在 它 所 属 进程 内 起 作用 。 一 个 进程 中 的 线 
程 ID 在 另 一 个 进程 中 并 无 意义 。 当 在 一 进程 中 对 多 个 线程 进行 操纵 时 ， 我 们 用 线程 ID 引用 相应 
的 线程 。 

控制 线程 的 函数 与 控制 进程 的 函数 类 似 ， 但 另 有 一 套 。 在 进程 模型 建立 很 久之 后 线程 模 
型 才 被 引入 到 UNIX 系 统 中 ， 这 两 个 模型 之 间 存在 复杂 的 相互 作用 ， 在 第 12 章 中 ， 我 们 会 对 此 
有 所 说 明 。 


1.7 出 错 处 理 


当 UNIX 函 数 出 错时 ， 常 常 返 回 一 个 负 值 ， 而 且 整 型 变量 errno 通 常 被 设置 为 舍 有 附加 信 
息 的 一 个 值 。 例 如 ，open 函 数 如 成 功 执 行 则 返回 一 个 非 负 文件 描述 符 ， 如 出 错 则 返回 1。 在 
open 出 错时 ， 有 大 约 15 种 不 同 的 errno 值 (文件 不 存在 、 权 限 问题 等 )。 某 些 函 数 并 不 返回 负 
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值 而 是 使 用 另 一 种 约定 。 例 如 ， 返 回 一 个 指向 对 象 指针 的 大 多 数 函 数 ， 在 出 错时 ， 将 返回 一 个 
null 指 针 。 

文件 <errno.h> 中 定义 了 符号 errno 以 及 可 以 赋予 它 的 各 种 常量 ， 这 些 常量 都 以 字符 E 开 
头 。 另 外 ，UNIX 系 统 手册 第 2 部 分 的 第 1 页 intro(2) 列 出 了 所 有 这 些 出 错 常量 。 例 如 ， 车 
errno 等 于 常量 EACCES， 这 表示 产生 了 权限 问题 (例如 ， 没 有 打开 所 要 求 文件 的 足够 权限 ) 。 


在 Linux 中 ， 出 错 常 量 在 errno(3) 手 册页 中 列 出 。 


POSIX 和 ISO C 将 errno 定 义 为 这 样 一 个 符号 , 它 扩展 成 为 一 个 可 修改 的 整 型 左 值 (lvalue ) 。 
这 可 以 是 包含 出 错 编号 的 一 个 整数 ， 或 者 是 一 个 返回 出 错 编号 指针 的 函数 。 以 前 使 用 的 定义 是 : 
extern int errno; 
但 是 在 支持 线程 的 环境 中 ， 多 个 线程 共享 进程 地 址 空间 ， 每 个 线程 都 有 属于 它 自己 的 局 部 
errno 以 避免 一 个 线程 干扰 另 一 个 线程 。 例 如 ，Linux 支 持 多 线程 存 取 errno， 将 其 定义 为 : 


extern int *  errno location(void); 
#define errno (*  errno location()) 


对 于 errno 应 当知 道 两 条 规则 。 第 一 条 规则 是 : 如 果 没 有 出 错 ， 则 其 值 不 会 被 一 个 例 程 清 

除 。 因 此 ， 仅 当 函 数 的 返回 值 指明 出 错时 ， 才 检验 其 值 。 第 二 条 是 : 任 一 函数 都 不 会 将 errno 

值 设置 为 0， 在 <errno.h> 中 定义 的 所 有 常量 都 不 为 0。 [14] 
C 标 准 定义 了 两 个 函数 ， 它 们 帮助 打印 出 错 信息 。 


#include <string.h> 


char *strerror(int errnum) ; 





返回 值 : 指向 消息 字符 串 的 指针 


此 函数 将 ermuwm ( 它 通 常 就 是 errno 值 ) 映射 为 一 个 出 错 信息 字符 串 ， 并 且 返 回 此 字符 串 的 指针 。 
Perror 国 数 基于 errno 的 当前 值 ， 在 标准 出 错 上 产生 一 条 出 错 消 息 ， 然 后 返回 。 


#include <stdio.h> 








void perror(const char *msg) ; 





它 首先 输出 由 msg 指 向 的 字符 串 ， 然 后 是 一 个 冒号 ， 一 个 空格 ， 接 着 是 对 应 于 errno 值 的 出 错 
信息 ， 最 后 是 一 个 换行 符 。 


a - s 
程序 清单 1-6 显 示 了 这 两 个 出 错 函 数 的 使 用 方法 。 


程序 清单 1-6 例 示 strerror 和 perror 





#include "apue.h" 
#include <errno.h> 


int 
main(int argc, char *argv[]) 


fprintf(stderr, "EACCES: %s\n", strerror (EACCES)); 
errno = ENOENT; 
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perror (argv[0] ) ; 
exit (0); 


如 果 编 译 此 程序 ， 将 结果 送 入 文件 a . out ， 然 后 执行 它 ， 则 有 : 


$ ./a.out 
EACCES: Permission denied 
./a.out: No such file or directory 


注意 ， 我 们 将 程序 名 (argv[0] ， 其 值 是 . /a.out) 作为 参数 传递 给 perror。 这 是 一 个 标准 
的 UNIX 惯 例 。 使 用 这 种 方法 ， 在 程序 作为 管道 线 的 一 部 分 执行 时 ， 例 如 : 


progl < inputfile | prog2 | prog3 > outputfile 
我 们 就 能 分 清 三 个 程序 中 的 哪 一 个 产生 了 一 条 特定 的 出 错 消 息 。 口 


本 书 中 的 所 有 实例 基本 上 都 不 直接 调用 strerror 或 perror， 而 是 使 用 附录 B 中 的 出 错 函 
数 。 该 附录 中 的 出 错 函 数 使 用 了 ISO C 的 可 变 参 数 表 功 能 ， 用 一 条 C 语 名 就 可 处 理 出 错 情况 。 

出 错 恢复 

可 将 在 <errno .h> 中 定义 的 各 种 出 错 分 成 致命 性 的 和 非 致命 性 的 两 类 。 对 于 致命 性 的 错 
误 ， 无 法 执行 恢复 动作 ， 最 多 只 能 在 用 户 屏幕 上 打印 出 一 条 出 错 消息 ， 或 者 将 一 条 出 错 消息 写 
和 日 志文 件 中 ， 然 后 终止 。 而 对 于 非 致命 性 的 出 错 ， 有 时 可 以 较 妥 善 地 进行 处 理 。 大 多 数 非 致 
命 性 出 错 在 本 质 上 是 暂时 的 ， 例 如 资源 短缺 ， 当 系统 中 的 活动 较 少 时 ， 这 种 出 错 很 可 能 不 会 发 
生 。 

与 资源 相关 的 非 致命 性 出 错 包 括 EAGAIN、ENEFILE、ENOBUFS、ENOLCK、ENOSPC、 
ENOSR、EWOULDBLOCK， 有 时 ENOMEM 也 是 非 致 命 性 出 错 。 当 EBBUSY 指 明 共 享 资 源 正在 使 用 
时 ， 也 可 将 它 作为 非 致命 性 出 错 处 理 。 当 EINTR 中 断 一 慢 速 系统 调用 时 ， 可 将 它 作 为 非 致命 性 
出 错 处 理 。 在 10.5 节 对 此 会 作 更 多 说 明 。 

对 于 资源 相关 的 非 致命 性 出 错 ， 一 般 恢复 动作 是 延迟 一 些 时 间 ， 然 后 再 试 。 这 种 技术 可 应 
用 于 其 他 情况 。 例 如 ， 假 设 一 个 出 错 表明 一 个 网 络 连接 不 再 起 作用 ， 那 么 应 用 程序 可 以 在 短 时 
间 延 迟 后 重建 该 连接 。 某 些 应 用 使 用 指数 补偿 算法 ， 在 每 次 重复 中 等 待 更 长 时 间 。 

最 后 ， 取 决 于 应 用 程序 的 开发 者 ， 他 可 以 决定 那些 出 错 是 可 恢复 的 。 如 若 使 用 一 种 从 错误 
中 恢复 的 合理 策略 ， 那 么 由 于 避免 了 应 用 程序 的 异常 终止 ， 就 能 改善 应 用 程序 的 健壮 性 。 


1.8 用 户 标识 


1. 用户 ID 

口令 文件 登录 项 中 的 用 户 ID (user ID) 是 个 数值 ， 它 向 系统 标识 各 个 不 同 的 用 户 。 系 统 
管理 员 在 确定 一 个 用 户 的 登录 名 的 同时 ， 确 定 其 用 户 ID。 用 户 不 能 更 改 其 用 户 ID。 通 常 每 个 
用 户 有 一 个 唯一 的 用 户 ID 。 下 面 将 介绍 内 核 如 何 使 用 用 户 ID 检验 该 用 户 是 否 有 执行 某 些 操作 
的 权限 。 

用 户 ID 为 0 的 用 户 为 根 (root) 或 超级 用 户 (superuser)。 在 口令 文件 中 ， 通常 有 一 个 登录 
项 ， 其 登录 名 为 oot， 我 们 称 这 种 用 户 的 特权 为 超级 用 户 特权 。 我 们 将 在 第 4 章 中 看 到 ， 如 果 
一 个 进程 具有 超级 用 户 特权 ， 则 大 多 数 文件 权限 检查 都 不 再 进行 。 某 些 操作 系统 功能 只 限于 向 
超级 用 户 提供 ， 超 级 用 户 对 系统 有 自由 的 支配 权 。 
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Mac OS X 客 户 闯 版 本 交 由 用 户 使 用 时 ， 禁 用 超级 用 户 账 户 ， 服 务 器 版 本 则 可 使 用 该 账户 。 在 
Apple 的 网 站 可 以 找到 指导 、 说 明 如 何 才 能 启用 该 账户 。 见 http://docs.info.apple.com/ 
article html?artnum-106290, 


2. 组 ID 

口令 文件 登录 项 也 包括 用 户 的 组 ID (group 呈 )， 它 是 一 个 数值 。 组 ZD 也 是 由 系统 管理 员 在 
指定 用 户 登 录 名 时 分 配 的 。 一 般 来 说 ， 在 口令 文件 中 有 多 个 记录 项 具有 相同 的 组 ID。 组 被 用 于 
将 若干 用 户 分 到 不 同 的 项 目 组 或 部 门 中 去 。 这 种 机 制 允 许 同 组 的 各 个 成 员 之 间 共 享 资 源 (例如 
文件 )。4.5 节 将 说 明 可 以 设置 文件 的 权限 使 组 内 所 有 成 员 都 能 存 取 该 文件 ， 而 组 外 用 户 则 不 能 。 

组 文件 将 组 名 映射 为 数字 组 ID， 它 通常 是 /etc/group。 

对 于 权限 ， 使 用 数值 用 户 ID 和 数值 组 ID 是 历史 上 形成 的 。 对 于 磁盘 上 的 每 个 文件 ， 文 件 系 
统 都 存放 该 文件 所 有 者 的 用 户 ID 和 组 ID。 存 放 这 两 个 值 只 需 4 个 字 节 (假定 每 个 都 以 双 字 节 的 
整 型 值 存放 )。 如 果 使 用 全 长 ASCII 登 录 名 和 组 名 ， 则 需 较 多 的 磁盘 空间 。 另 外 ， 在 查验 权限 期 
间 ， 比 较 字 符 串 较 之 比较 整 型 数 更 消耗 时 间 。 

但 是 对 于 用 户 而 言 ， 使 用 名 字 比 使 用 数值 方便 ， 所 以 口令 文件 包含 了 登录 名 和 用 户 ID 之 间 
的 映射 关系 ， 而 组 文件 则 包含 了 组 名 和 组 ID 之 间 的 映射 关系 。 例 如 UNIX 1s -1 命令 使 用 口令 
文件 将 数值 用 户 ID 映射 为 登录 名 ， 从 而 打印 文件 所 有 者 的 登录 名 。 


早期 的 UNIX 系 统 使 用 16 位 整 型 数 表 示 用 户 ID 和 组 ID。 现 今 的 UNIX 系 统 使 用 32 位 整 型 数 表 示 用 户 
ID 和 组 ID | 


实 例 
程序 清单 1-7 用 于 打印 用 户 ID 和 组 1D。 
程序 清单 1-7 ”打印 用 户 ID 和 组 ID 


#include "apue.h" 
int 


main (void) 


printf ("uid = td, gid = $dWMn", getuid(), getgid()); 
exit (0); 


调用 getuid 和 getgid 以 返回 用 户 ID 和 组 ID。 运 行 该 程序 ， 将 产生 


$ ./a.out 

uid - 205, gid - 105 D 

3. 附加 组 ID 

除了 在 口令 文件 中 对 一 个 登录 名 指定 一 个 组 ID 外 ， 大 多 数 UNIX 系 统 版 本 还 允许 一 个 用 户 
属于 另外 的 组 。 这 是 从 4.2BSD 开 始 的 ， 它 允许 一 个 用 户 属于 多 至 16 个 另外 的 组 。 登 录 时 ， 读 文 
件 /etc/group， 寻 找 列 有 该 用 户 作 为 其 成 员 的 前 16 个 记录 项 就 可 得 到 该 用 户 的 附加 组 ID 
(supplementary group ID ) 。 在 下 一 章 将 说 明 ，POSIX 要 求 系 统 至 少 应 支持 8 个 附加 组 ， 实 际 上 大 
多 数 系统 至 少 支持 16 个 附加 组 。 
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19 信和 号 


信号 (signal) 是 通知 进程 已 发 生 某 种 情况 的 一 种 技术 。 例 如 ， 若 某 一 进程 执行 除法 操 
作 ， 其 除数 为 0， 则 将 名 为 SIGFPBE (FARE) 的 信号 发 送 给 该 进程 。 进 程 如 何 处 理 信号 有 
三 种 选择 。 

(1) 忽略 该 信号 。 有 些 信 和 号 表示 硬件 异常 ， 例 如 ， 除 以 0 或 访问 进程 地 址 空间 以 外 的 单元 等 ， 
因为 这 些 异 常 产生 的 后 果 不 确定 ， 所 以 不 推荐 使 用 这 种 处 理 方式 。 

(2) 按 系统 默认 方式 处 理 。 对 于 除 以 0 的 情况 ， 系 统 默认 方式 是 终止 该 进程 。 

(3) 提供 一 个 函数 ， 信 和 号 发 生 时 则 调用 该 函数 ， 这 被 称 为 捕捉 该 信号 。 使 用 这 种 方式 ， 我 
们 只 要 提供 自 编 的 函数 就 将 能 知道 什么 时 候 产 生 了 信号 ， 并 按 所 希望 的 方式 处 理 它 。 

很 多 情况 会 产生 信号 。 终端 键盘 上 有 两 种 产生 信号 的 方法 , 分 别称 为 中 断 键 (interrupt key, 
通常 是 Delete 键 或 Ctrl+C) 和 退出 键 (quit key， 通 常 是 Ctrl+\) ， 它 们 被 用 于 中 断 当 前 运行 的 进 
程 。 另 一 种 产生 信号 的 方法 是 调用 名 为 ki11 的 函数 。 在 一 个 进程 中 调用 此 函数 就 可 向 另 一 个 
进程 发 送 一 个 信号 。 当 然 这 样 做 也 有 些 限 制 ， 当 向 一 个 进程 发 送信 和 号 时 ， 我 们 必须 是 该 进程 的 
所 有 者 或 者 是 超级 用 户 。 





回忆 一 下 前 面 的 简化 shell 程 序 ( 见 程序 清单 1-5) 。 如 果 调 用 此 程序 ， 然 后 键入 中 断 键 ， 则 
执行 此 程序 的 进程 终止 。 产 生 这 种 后 果 的 原因 是 ， 对 于 此 信号 (SIGINT) 的 系统 默认 动作 是 
终止 进程 。 该 进程 没有 告诉 系统 内 核对 此 信号 作 何 种 处 理 ， 所 以 系统 按 默认 方式 终止 该 进程 。 

为 使 该 程序 能 捕 提 到 此 信号 ， 它 需要 调用 signal 函数 ， 由 其 指定 当 产生 SIGINT 信 号 时 要 
调用 的 函数 名 。 为 此 编写 了 名 为 sig_int 的 函数 ， 当 其 被 调用 时 ， 它 只 是 打印 一 条 消息 ， 然 后 
打印 一 个 新 提示 符 。 在 程序 清单 1-5 中 添加 了 11 行 ， 构 成 了 程序 清单 1-8 (添加 的 11 行 以 行 首 的 + 
号 表示 )。 


程序 清单 1-8 从 标准 输入 读 命令 并 执行 


#include "apue .hr 
#include «sys/wait.h» 


+ static void sig int (int); /* our signal-catching function */ 
+ 

int 

main (void) 


char buf [MAXLINE] ; /* from apue.h */ 
pid_t pid; 
int status; 

+ if (signal (SIGINT, sig int) == SIG ERR) 


+ 


err sys("signal error"); 
printf("$$ "); /* print prompt (printf requires $$ to print $) */ 
while (fgets(buf, MAXLINE, stdin) != NULL) { 
if (buf{strlen(buf) - 1] == ‘\n’') 
buf[strlen(buf) - 1] - 0; /* replace newline with null */ 


if ((pid = fork()) « 0) { 
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err SyS("fork error"); 

) else if (pid == 0) { /* child */ 
execlp(buf, buf, (char *)0); 
err ret ("couldn't execute: $s", buf); 
exit (127); 


} 
/* parent */ 
if ((pid = waitpid(pid, &status, 0)) « 0) 
err_sys ("waitpid error"); 
printf("$& "); 
exit (0); 
void 


sig_int (int signo) 


printf ("interrupt\n%% "); 


++ tteet 


因为 大 多 数 重要 的 应 用 程序 都 将 使 用 信号 ， 所 以 第 10 章 将 详细 介绍 信号 。 口 


1.10 时 间 值 


“长 期 以 来 ，UNIX 系 统一 直 使 用 两 种 不 同 的 时 间 值 ; 

(1) 日 历时 间 。 该 值 是 自 1970 年 1 月 1 日 00:00:00 以 来 国际 标准 时 间 (UTC) 所 经 过 的 秒 数 累 
计 值 (早期 的 手册 称 UTC 为 格林 尼 治 标准 时 间 )。 这 些 时 间 值 可 用 于 记录 文件 最 近 一 次 的 修改 
时 间 等 。 

系统 基本 数据 类 型 time_t 用 于 保存 这 种 时 间 值 。 

(2) 进程 时 间 。 这 也 被 称 为 CPU 时 间 ， 用 以 度量 进程 使 用 的 中 央 处 理 机 资源 。 进 程 时 间 以 
时 钟 滴答 计算 ， 历 史上 曾经 取 每 秒 钟 为 50、60 或 100 个 滴答 。 

系统 基本 数据 类 型 c1ock_t 用 于 保存 这 种 时 间 值 。2.5.4 节 将 说 明 如 何 用 sysconf 函 数 得 
到 每 秒 时 钟 滴答 数 。 

当 度 量 一 个 进程 的 执行 时 间 时 ( 见 3.9 节 )，UNIX 系 统 使 用 三 个 进程 时 间 值 ; 

* 时 钟 时 间 。 

“用户 CPU 时 间 。 

。 系 统 CPU 时 间 。 

时 钟 时 间 又 称 为 墙 上 时 钟 时 间 (wall clock time) 。 它 是 进程 运行 的 时 间 总 量 ， 其 值 与 系统 
中 同时 运行 的 进程 数 有 关 。 每 当 在 本 书 中 述 及 时 钟 时 间 时 ， 都 是 在 系统 中 没有 其 他 活动 时 进行 
度量 的 。 

用 户 CPU 时 间 是 执行 用 户 指令 所 用 的 时 间 。 系 统 CPU 时 间 是 为 该 进程 执行 内 核 程序 所 经 历 
的 时 间 。 例 如 ， 每 当 一 个 进程 执行 一 个 系统 服务 时 ， 例 如 reaqa 或 write， 则 在 内 核 内 执行 该 
服务 所 花费 的 时 间 就 计 和 人 该 进程 的 系统 CPU 时 间 。 用 户 CPU 时 间 和 系统 CPU 时 间 之 和 常 被 称 为 
CPU 时 间 。 

要 取得 任 一 进程 的 时 钟 时 间 、 用 户 时 间 和 系统 时 间 是 很 容易 的 一 一 只 要 执行 命令 time(1)， 
其 参数 是 要 度量 其 执行 时 间 的 命令 ， 例 如 : 
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$ ed /usr/include 
$ time -p grep POSIX SOURCE */*.h > /dev/null 


real 0m0.81s 
user Om0.11s 
sys 0m0.07s 


cime 命 令 的 输出 格式 与 所 使 用 的 shel 有 关 ， 其 原因 是 某 些 shell 并 不 运行 /usr/binytime， 而 
是 使 用 一 内 置 函 数 测量 命令 运行 所 使 用 的 时 间 。 
8.16 节 将 说 明 一 个 运行 进程 如 何 取得 这 三 个 时 间 。 关 于 时 间 和 日 期 的 一 般 说 明 见 6.10 节 。 


1.11 系统 调用 和 库 函 数 


所 有 的 操作 系统 都 提供 多 种 服务 的 人 口 点 ， 程 序 由 此 向 内 核 请 求 服务 。 各 种 版 本 的 UNIX 
实现 都 提供 定义 明确 、 数 量 有 限 、 可 直接 进入 内 核 的 入 口 点 ， 这 些 入 口 点 被 称 为 系统 调用 ( 见 
图 1-1)。Research UNIX 第 7 版 提供 了 约 50 个 系统 调用 ， 4.4BSD 提 供 了 约 110 个 ， 而 SVR4 则 提供 
了 约 120 个 。Linux 的 不 同 版 本 提供 了 240 ~260 个 系统 调用 。 FreeBSD 大 约 提供 了 320 个 。 

系统 调用 接口 总 是 在 《UNIX 程 序 员 手 册 》 的 第 2 部 分 中 说 明 ， 其 定义 也 包括 在 C 语 言 中 ， 
这 与 具体 系统 如 何 调用 系统 调用 的 实现 技术 无 关 。 与 很 多 早期 的 操作 系统 不 同 ， 这 些 系统 按 传 
统 方式 在 机 器 的 汇编 语言 中 定义 内 核 入 口 点 。 

UNIX 所 使 用 的 技术 是 为 每 个 系统 调用 在 标准 C 库 中 设置 一 个 具有 同样 名 字 的 函数 。 用 户 进 
程 用 标准 C 调 用 序列 来 调用 这 些 函 数 ， 然 后 ， 函 数 又 用 系统 所 要 求 的 技术 调用 相应 的 内 核 服务 。 
例如 函数 可 将 一 个 或 多 个 C 参 数 送 入 通用 寄存 器 ， 然 后 执行 某 个 产生 软 中 断 进 入 内 核 的 机 器 指 
令 。 从 应 用 角度 考虑 ， 可 将 系统 调用 视 作为 C 函 数 。 

《UNIX 程 序 员 手 册 》 的 第 3 部 分 定义 了 程序 员 可 以 使 用 的 通用 函数 。 虽 然 这 些 函 数 可 能 会 
调用 一 个 或 多 个 内 核 的 系统 调用 ， 但 是 它们 并 不 是 内 核 的 入 口 点 。 例 如 ，printf 函 数 会 调用 
write 系统 调用 以 输出 一 个 字符 种， 但 函数 strcpy (复制 一 字符 串 ) 和 atoi (变换 ASCH 为 
整数 ) 并 不 使 用 任何 系统 调用 。 

从 实现 者 的 角度 观察 ， 系 统 调用 和 库 函 数 之 间 有 重大 区 别 ， 但 从 用 户 角度 来 看 ， 其 区 别 并 
不 非常 重要 。 在 本 书 中 ， 系 统 调用 和 库 函 数 都 以 C 函 数 的 形式 出 现 ， 两 者 都 为 应 用 程序 提供 服 
务 。 但 是 ， 我 们 应 当 理解 ， 必 要 时 我 们 可 以 替换 库 函 数 ， 而 通常 却 不 能 替换 系统 调用 。 

以 存储 器 分 配 函 数 mnal1loc 为 例 。 有 多 种 方法 可 以 进行 存储 器 分 配 及 与 其 相关 的 无 用 区 收 
RRE (最 佳 适应 、 首 次 适应 等 )， 并 不 存在 对 所 有 程序 都 最 佳 的 一 种 技术 。 UNIX 系 统 调用 中 
处 理 存储 器 分 配 的 是 sbrk(2)， 它 不 是 一 个 通用 的 存储 器 管理 器 。 它 按 指定 字 节 数 增加 或 减少 
进程 地 址 空间 。 如 何 管理 该 地 址 空间 却 取决 于 进程 。 存 储 器 分 配 函 数 mal1loc(3) 实 现 一 种 特定 
类 型 的 分 配 。 如 果 我 们 不 喜欢 其 操作 方式 ， 则 可 以 定义 自己 的 malloc 函数 ， 它 很 可 能 将 使 用 
sbrk 系 统 调用 。 事 实 上 ， 有 很 多 软件 包 ， 它 们 使 用 sbrk 系 统 调用 实现 自己 的 存储 器 分 配 算 法 ， 
图 1-2 显 示 了 应 用 程序 、malloc 函 数 以 及 sbrk 系 统 调用 之 间 的 关系 。 

从 中 可 见 ， 两 者 职责 不 同 ， 内 核 中 的 系统 调用 分 配 另外 一 块 空间 给 进程 ， 而 库 函 数 
malloc 则 在 用 户 层次 管理 这 一 空间 。 

另 一 个 可 说 明 系 统 调用 和 库 函 数 之 间 的 差别 的 例子 是 UNIX 系 统 提供 的 决定 当前 时 间 和 日 
期 的 接口 。 某 些 操作 系统 提供 一 个 系统 调用 以 返回 时 间 ， 提 供 另 一 个 以 返回 日 期 。 任 何 特殊 的 
处 理 ， 例 如 正常 时 制 和 夏 时 制 之 间 的 转换 ， 则 由 内 核 处 理 或 要 求人 为 干预 ， UNIX 系 统 则 不 同 ， 
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它 只 提供 一 条 系统 调用 ， 该 系统 调用 返回 国际 标准 时 间 1970 年 1 月 1 日 零点 以 来 所 经 过 的 秒 数 。 
对 该 值 的 任何 解释 ， 例 如 将 其 变换 成 人 们 可 读 的 、 适 用 于 本 地 时 区 的 时 间 和 日 期 ， 都 留 给 用 户 
进程 进行 处 理 。 在 标准 C 库 中 ， 提 供 了 若干 例 程 以 处 理 大 多 数 情况 。 这 些 库 函 数 处 理 各 种 细节 ， 
例如 各 种 夏 时 制 算法 等 。 

应 用 程序 可 以 调用 系统 调用 或 者 库 函 数 ， 而 很 多 库 函 数 则 会 调用 系统 调用 。 这 在 图 1-3 中 
显示 。 


























用 户 进程 用 户 进程 
Y 
sbrk 
系统 调用 
内 核 
图 1-2 malloc 函 数 和 sbrk 系 统 调用 图 1-3 C 库 函数 和 系统 调用 之 间 的 差别 


系统 调用 和 库 函 数 之 间 的 另 一 个 差别 是 ， 系 统 调用 通常 提供 一 种 最 小 接口 ， 而 库 函 数 通 常 提 
供 比较 复杂 的 功能 。 我 们 从 sbrk 系 统 调用 和 malloc 库 函数 之 间 的 差别 中 可 以 看 到 这 一 点 ， 在 以 
后 比较 不 带 缓冲 的 VO 函数 〈 见 第 3 章 ) 以 及 标准 VO 函数 ( 见 第 5 章 ) 时 ， 还 将 看 到 这 种 差别 。 

进程 控制 系统 调用 (fork, execfüwait) 通常 由 用 户 应 用 程序 直接 调用 (请 回忆 程序 清 
单 1-5 中 的 基本 shell) 。 但 是 为 了 简化 某 些 常见 的 情况 ，UNIX 系 统 也 提供 了 一 些 库 函 数 ， 例 如 
system 和 popen。8.13 节 将 说 明 system 函 数 的 一 种 实现 ， 它 使 用 基本 的 进程 控制 系统 调用 。 
10.18 节 还 将 强化 这 一 实例 以 正确 地 处 理 信号 。 

为 使 读者 了 解 大 多 数 程序 员 应 用 的 UNIX 系 统 接口 ， 我 们 不 得 不 既 说 明 系 统 调 用 ， 又 介绍 某 
些 库 国 数 。 例 如 ， 若 只 说 明 sbrk 系 统 调用 ， 那 么 就 会 忽略 很 多 应 用 程序 使 用 的 malloc 库 国 数 。 
除了 必须 要 区 分 两 者 时 ， 本 书 都 将 使 用 术语 函数 (function) 来 表示 系统 调用 和 库 函 数 两 者 。 


1.12 小 结 


本 章 快速 浏览 了 UNIX 系 统 。 说 明了 某 些 以 后 会 多 次 用 到 的 基本 术语 ， 介 绍 了 一 些小 的 
UNIX 程 序 实例 ， 使 读者 对 本 书 其 余部 分 将 会 进一步 介绍 的 内 容 有 一 些 感性 认识 。 

下 一 章 将 讲述 UNIX 系 统 的 标准 ， 以 及 这 方面 的 工作 对 当前 系统 的 影响 。 标 准 ， 特 别 是 ISO 
C 标 准 和 POSIX.1 标 准将 影响 本 书 的 余下 部 分 。 
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习题 


1.1 
1.2 


在 系统 上 查证 ， 除 根 目 录 外 ， 目 录 . 和.. 是 不 同 的 。 

分 析 程 序 清单 1-4 的 输出 ， 说 明 进 程 ID 为 852 和 853 的 进程 发 生 了 什么 情况 。 

在 1.7 节 中 ，perror 的 参数 是 用 ISO C 的 属性 const 定 义 的 ， 而 strerror 的 整 型 参数 则 
没有 用 此 属性 定义 ， 为 什么 ? 

在 附录 B 包 含 了 出 错 处 理子 数 err.sys， 当 调用 该 函数 时 ， 先 保存 了 errno 的 值 ， 为 什 
A? 

若 日 历时 间 存 放 在 带 符号 的 32 位 整 型 数 中 ， 那 么 到 哪 一 年 它 将 溢出 ? 可 以 用 什么 方法 扩展 
浮 点 数 ? 它们 是 否 与 已 存在 的 应 用 相 兼 容 ? 

车 进程 时 间 存 放 在 带 符号 的 32 位 整 型 数 中 ， 而 且 每 秒 为 100 滴 答 ， 那 么 经 过 多 少 天 后 该 时 
间 值 将 会 溢出 ? 
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第 2 章 
UNIX 标 准 化 及 实现 





2.1 引言 


在 UNIX 编 程 环境 和 C 程 序 设计 语言 的 标准 化 方面 已 经 做 了 很 多 工作 。 虽 然 UNIX 应 用 程序 
在 不 同 的 UNIX 操 作 系统 版 本 之 间 进 行 移植 相当 容易 ， 但 是 20 世 纪 80 年 代 UNIX 版 本 的 剧 增 以 及 
它们 之 间 差别 的 扩大 ， 导 致 很 多 大 用 户 (例如 美国 政府 ) 呼吁 对 其 进行 标准 化 。 

本 章 首先 将 介绍 过 去 20 年 来 进行 的 各 种 标准 化 工作 ， 然 后 讨论 这 些 UNIX 编 程 标准 对 本 书 
所 列举 的 各 种 UNIX 操 作 系统 实现 的 影响 。 所 有 标准 化 工作 的 一 个 重要 部 分 是 对 每 种 实现 必须 
定义 的 各 种 限制 进行 说 明 ， 所 以 我 们 将 说 明 这 些 限制 以 及 确定 其 值 的 各 种 方法 。 


2.2 UNIX 标 准 化 
2.2.1 ISOC 


1989 年 下 半年 ，C 程 序 设计 语言 的 ANSI 标 准 X3.159-1989 得 到 批准 。 此 标准 已 被 采纳 为 国 
际 标准 ISO/IEC 9899: 1990, ANSI 是 美国 国家 标准 学 会 (American National Standards Institute) , 
它 在 国际 标准 化 组 织 (International Organization for Standardization，ISO) 中 是 代表 美国 的 成 
员 。IEC 是 国际 电子 技术 委员 会 (International Electrotechnical Commission) 的 缩写 。 

ISO C 标 准 现在 由 ISO/IEC 的 C 程 序 设计 语言 国际 标准 化 工作 组 维护 和 开发 ， 该 工作 组 被 称 
为 ISO/IEC JTC1/SC22/WG14， 简 称 WG14。ISO C 标 准 的 意图 是 提供 C 程 序 的 可 移植 性 ， 使 其 
能 适合 于 大 量 不 同 的 操作 系统 ， 而 不 只 是 UNIX 系 统 。 此 标准 不 仅 定义 了 C 程 序 设计 语言 的 语法 
和 语义 ， 还 定义 了 其 标准 库 [ISO 1999 第 7 章 ， Plauger 1992，Kernighan 及 Ritchie 1988 中 的 附录 
B]。 因 为 所 有 现今 的 UNIX 系 统 ( 例 如 本 书 介绍 的 几 个 UNIX 系 统 ) 都 提供 C 标 准 中 定义 的 库 例 
程 ， 所 以 该 标准 库 是 很 重要 的 。 

在 1999 年 ，ISO C 标 准 被 更 新 为 ISO/IEC 9899, 1999。 新 标准 显著 改善 了 对 进行 数值 处 理 
的 应 用 程序 的 支持 。 除 了 对 某 些 函 数 原 型 增加 了 关键 字 restrict 外 ， 这 些 改变 并 不 影响 本 书 
中 说 明 的 POSTX 标 准 。 该 关键 字 用 于 告诉 编译 器 ， 哪些 指针 引用 是 可 以 优化 的 ， 其 方法 是 指明 
指针 指向 的 对 象 ， 在 函数 中 只 通过 该 指针 进行 访问 。 

如 同 大 多 数 标准 一 样 ， 在 批准 标准 和 修改 软件 以 使 其 符合 标准 这 两 者 之 间 有 一 段 时 间 上 的 
延迟 。 随 着 供应 商 的 编译 系统 不 断 演 进 ， 对 ISO C 标 准 最 新 版 本 的 支持 也 越 来 越 多 。 


gcc 对 ISO C 标 准 1999 版 本 的 当前 符合 程度 的 总 结 可 见 ; http: //www.gnu.org/software/ 
gcc/c99status.html, 
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按照 该 标准 定义 的 各 个 头 文件 (header) ， 可 将 ISO C 库 分 成 24 个 区 。 表 2-1 中 列 出 了 C 标 准 
定义 的 各 个 头 文件 。POSIX.1 标 准 包括 这 些 头 文件 以 及 另外 一 些 头 文件 。 表 中 也 列 出 了 四 种 
UNIX 实 现 (FreeBSD 5.2.1、Linux 2.4.22、Mac OS X 10.3 和 Solaris 9) 所 支持 的 头 文件 。 本 章 
后 面 将 对 这 四 种 UNIX 实 现 进行 说 明 。 


表 2-1 ISO C 标 准 定义 的 头 文件 


X €x dt FreeBSD 5.2.1 Linux 24.22 Mac OS X 10.3 Solaris 9 
A | 


<assert.h> 。 给 证 程序 断言 
<complex.h> 支持 复数 算术 运算 
<Ctype .h> . 字符 类 型 
<errno.h> . 出 错 码 (1.75) 
<fenv.h> TPA 
«float.h» . 浮 点 当量 
<inttypes.h> 整 型 格式 转换 
<iso646.h> 替代 关系 操作 符 宏 
<limits.h> 实现 常量 (2.545) 
<locale.h> 局 部 类 别 
<math.h> 数学 常量 
<setjmp.h> 非 局 部 goto ( 7.10 节 ) 
<signal.h> 信号 (第 10 章 ) 
<stdarg.h> 可 变 参数 表 
«stdbool.h» 布尔 类 型 和 值 
<stddef .h> 。 标准 定义 
<stdint.h> 整 型 

<stdio.h> . 标准 MO 库 (第 5 章 ) 
<stdlib.h> . 实用 程序 函数 
<string.h> . 字符 串 操作 
<tgmath.h> 通用 类 型 数学 宏 
<time.h> . 时 间 和 日 期 (6.10 节 ) 
«wchar.h» 扩展 的 多 字 节 和 宽 字符 支持 
<wctype.h> 宽 字符 分 类 和 映射 支持 





ISO C 头 文件 依赖 于 操作 系统 所 配置 的 C 编 译 器 的 版 本 。 在 考虑 表 2-1 时 ,应 当 注意 FreeBSD 5.2.1 
配置 了 gcc 3.3.3)&, Solaris 9 同时 配置 了 gcc 2.95.3 版 和 gcc 3.2 版 ，Mandrake 9.2 (Linux 2.4.22) 配置 
了 gcc 3.3.1 版 ，Mac OS X& € f gcc 3.3%, Mac OS X 还 包括 了 gcc 的 较 早 版 本 。 


2.2.2 IEEE POSIX 


POSIX 是 一 系列 由 IEEE (Institute of Electrical and Electronics Engineers, #45 电子 工程 
师 协会 ) 制定 的 标准 。POSIX 指 的 是 可 移植 的 操作 系统 接口 (Portable Operating System 
Interface)。 它 原来 指 的 只 是 IEEE 标 准 1003.1-1988 (操作 系统 接口 )， 后 来 则 扩展 成 包括 很 多 标 
记 为 1003 的 标准 及 标准 草案 ， 包 括 shell 和 实用 程序 (1003.2), 

与 本 书 相关 的 是 1003.1 操 作 系 统 接口 标准 ， 读 标 准 的 目的 是 提高 应 用 程序 在 各 种 UNIX 系 统 
环境 之 间 的 可 移植 性 。 它 定义 了 “依从 POSIX 的 ”(POSIX compliant) 操作 系统 必须 提供 的 各 
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种 服务 。 该 标准 已 被 大 多 数 计 算 机 制造 商 采 用 。 虽 然 1003.1 标 准 是 以 UNIX 操 作 系统 为 基础 的 ， 
但 是 它 并 不 限于 UNIX 和 类 似 于 UNIX 的 系统 。 确 实 ， 有 些 供应 专 有 操作 系统 的 制造 商 也 声称 这 
些 系统 将 依从 POSIX (同时 还 保有 它们 的 所 有 专 有 功能 )。 

由 于 1003.1 标 准 定义 了 一 个 接口 (interface) 而 不 是 一 种 实现 (implementation) ， 所 以 并 不 
区 分 系统 调用 和 库 函 数 。 标 准 中 的 所 有 例 程 都 称 为 函数 。 

标准 是 不 断 演变 的 ，1003.1 标 准 也 不 例外 。 该 标准 的 1988 版 ， 即 卫 EE 1003.1-1988， 经 修改 
后 提交 给 ISO。 它 没有 增加 新 的 接口 或 功能 ， 但 修订 了 文本 。 最 终 的 文档 作为 IEEE Std.1003.1- 
1990 正 式 出 版 [IEEE 1990]， 这 也 就 是 国际 标准 ISO/IEC 9945-1:1990。 该 标准 通常 被 称 为 
POSIX.1， 本 书 将 使 用 此 标准 。 

IEEE 1003.1 工 作 组 继续 对 标准 做 出 修改 ， 并 在 1993 年 出 版 了 IEEE 1003.1 标 准 的 修订 版 。 它 
包括 了 1003.1-1990 标 准 和 1003.1b-1993 实 时 扩展 标准 。1996 年 ， 该 标准 再 次 更 新 为 国际 标准 
ISO/IEC 9945-1:1996。 它 包括 了 多 线程 编程 的 接口 ， 称 为 pthreads， 指 的 就 是 POSIX 线 程 。1999 
年 出 版 了 IEEE 标 准 1003.1d-1999， 其 中 增加 了 更 多 实时 接口 。 一 年 后 ， 出 版 了 IEEE 标 准 1003.1j- 
2000 和 1003.1q-2000， 前 者 包含 了 更 多 实时 接口 ， 后 者 增加 了 标准 在 事件 跟踪 方面 的 扩展 。 

1003.1 的 2001 版 与 以 前 各 版 本 有 较 大 的 差别 ， 它 组 合 了 1003.1 的 多 次 修订 、1003.2 标 准 以 及 
Single UNIX Specification (SUS) 第 2 版 的 若干 部 分 (对 于 SUS， 后 面 将 作 更 多 说 明 ) 。 最 终 形 
成 了 IEEE 标 准 1003.1-2001 ， 其 中 包括 了 下 列 几 个 标准 。 

* ISO/IEC 9945-1 (IEEE 标 准 1003.1-1996) ， 它 包括 

。IEEE 标 准 1003.1 - 1990, 

。IEEE 标 准 1003.1b - 1993 (实时 扩展 )。 
。IEEE 标 准 1003.1c- 1995 (pthreads)。 
。IEEE 标 准 1003.1i- 1995 (实时 技术 勘误 表 )。 

* IEEE P1003.1a 标 准 草案 (系统 接口 修订 版 )。 

。IEEE 标 准 1003.1d - 1999 (高 级 实时 扩展 ) 。 

。IEEE 标 准 1003.1j - 2000 (更 高 级 的 实时 扩展 )。 

。IEEE 标 准 1003.19q - 2000 (文件 跟踪 )。 

。IEEE 标 准 1003.2d - 1994. ( 批 处 理 扩展 )。 

* IEEE P1003.2b 草 案 标 准 (附加 的 实用 程序 )。 

*IEEE 标 准 1003.1g - 2000 (协议 无 关 接口 ) 的 某 些 部 分 。 

* ISO/IEC 9945-2 (IEEE 标 准 1003.2 - 1993), 

。Single UNIX Specification 第 2 版 的 基本 规范 ， 包 括 

。 系 统 接 口 定义 ， 第 5 发 行 版 。 
* 命令 和 实用 程序 ， 第 5 发 行 版 。 
。 系 统 接 口 和 头 文件 ， 第 5 发 行 版 。 

。 开 放 组 技术 标准 ， 网 络 服务 ，5.2 发 行 版 。 

。ISO/IEC 9899:1999 ，C 编 程 语言 。 

表 2-2、 表 2-3 以 及 表 2-4 总 结 了 POSIX.1 指 定 的 必需 和 可 选 的 头 文件 。 因 池 5SD4 刀 括 多 OC 
C 标 准 库 函 数 ， 所 以 它 还 需要 表 2-1 中 列 出 的 头 文件 。 这 4 个 表 总 结 了 本 :于 中 下 人 的 4 各 NIX 驮 
统 实现 中 包括 的 头 文件 。 
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表 2-2 ”POSIX 标 准 定义 的 必需 的 头 文件 


FreeBSD 5.2.1 Linux 2.4.22 Mac OSX 10.3 Solaris9 


«dirent.h» 


<fentl.h> 


«fnmatch.h» 
<glob.h> 


<grp.h> 
<netdb.h> 
<pwd.h> 
«regex.h» 
«tar.h» 
«termios.h» 
<unistd.h> 
<utime.h> 
<wordexp.h> 
«arpa/inet.h» 
«net/if.h» 
«netinet/in.h» 
«netinet/tcp.h» 
«sys/mman.h» 
«sys/select.h» 
<sys/socket.h> 
«sys/stat.h» 
<sys/times.h> 
<sys/types.h> 
<sys/un.h> 
<sys/utsname.h> 


«sys/wait.h» 


2-3 POSIX 标 准 定义 的 XSI 扩 展 头 文件 


FreeBSD 5.2.1 Linux 2.4.22 MacOS X10.3 Solaris 9 


<cpio.h> 
«difcn h> 
<fmtmsg h> 
«ftw h> 
«iconv h> 


<langinfo h> 


RB 


"«monetary.h» 


«ndbm h> 

|j. «nl types h> 
«poll.h» 
«search h> 


«strings h» 
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Bx (42145) 

文件 控制 (3.1415) 
文件 名 匹配 类 型 

路 径 名 模式 匹配 类 型 

组 文件 (6.4 节 ) 

网 络 数据 库 操 作 

口令 文件 (6.2 节 ) 

正则 表达 式 

tar 归 档 值 

终端 VO (第 18 章 ) 

符号 常量 

文件 时 间 (4.19 节 ) 

字 扩 展 类 型 

Internet 定 义 (第 16 童 ) 

套 接 字 本 地 接口 (第 16 音 ) 
Internet 地 址 族 (16.3 节 ) 
传输 控制 协议 定义 

内 存 管理 声明 

select MR (14.5.1 节 ) 
Erin (第 16 章 ) 
文件 状态 (第 4 章 ) 
进程 时 间 (8.16 节 ) 

基本 系统 数据 类 型 (2.85) 
UNIX 域 套 接 字 定 义 (17.3 节 ) 
系统 名 (6.9 节 ) 

进程 控制 (8.6 节 ) 





cpio 归 档 值 

动态 链接 

消息 显示 结构 
文件 树 漫游 (4.21 节 ) 
代码 集 转换 实用 程序 
语言 信息 常量 
模式 匹配 函数 定义 
货币 类 型 
数据 库 操作 
消息 类 别 

轮 询 函数 (14.5.2 节 ) 
搜索 表 

TARRE 
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( 续 ) 


系统 出 错 日 志 记录 (13.4 节 ) 
用 户 上 下 文 

用 户 限制 

用 户 账户 数据 库 
IPC (15.6 节 ) 



















<syslog.h> 









<ucontext.h> 


«ulimit.h» 








«utmpx.h» 











«sys/ipc.h» 





















«sys/msg.h» 消息 队列 (15.738) 
«sys/resource.h» 资源 操作 (7.1159) 
<sys/sem.h> 信号 量 (15.955) 
«sys/shm.h» 共享 存储 (15.935) 
«sys/statvfs.h» 文件 系统 信息 
«sys/time.h» 时 间 类 型 
<sys/timeb.h> 附加 的 日 期 和 时 间 定 义 


<sys/uio.h> 


矢量 VO 操作 (14.75) 


表 2-4 ” POSIX 标准 定义 的 可 选 头 文件 


BSD 1 Lmml42 Mac OSK103 soto 


异步 VO 
消息 队列 


<aio.h> 






<mqueue.h> 


















«pthread.h» 线程 (第 11 、12 章 ) 
<sched.h> 执行 调度 
<semaphore.h> 信号 量 
<spawn.h> 实时 spawn 接 口 






<stropts.h> XSI STREAMSSEH (14.444) 


事件 跟踪 


«trace.h» 


本 书 中 描述 了 POSIX.1 的 2001 版 ， 包 括 ISO C 标 准 所 指定 的 各 个 函数 。 其 接口 分 成 了 两 类 : 
必需 接口 和 可 选 接口 。 可 选 接口 按 功能 又 进一步 分 成 530 个 区 。 表 2-5 中 按 它们 各 自 的 选项 代码 
总 结 了 没有 被 弃 用 的 编程 接口 。 选 项 代码 是 由 2~3 个 字符 构成 的 字母 缩写 ， 以 便 标识 属于 各 个 
功能 区 的 接口 。 选 项 代码 会 突出 显示 手册 相关 页 面 上 的 文本 ， 表 明 接口 依赖 于 对 特定 选项 的 支 
持 。 很 多 选项 处 理 实时 扩展 。 


表 2-5 _POSIX.1 可 选 接口 组 和 代码 


_POSIX_ADVISORY_INFO | 建议 性 信息 (实时 ) | (实时 ) 
__POSIX_ASYNCHRONOUS_IO 异步 输入 和 输出 (实时) 
_POSIX_BARRIERS 屏障 (实时) 


_POSIX_CPUTIME 进程 CPU 时 钟 (实时 ) 
_POSIX_CLOCK_SELECTION 时 钟 选择 (实时 ) 
ISO C 标 准 扩展 
_POSIX_FSYNC 文件 同步 
_POSIX_IPV6 IPv6 接 口 
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—POSIX_MAPPED_FILES 
—POSIX_MEMLOCK 
.POSIX MEMLOCK RANGE 
.POSIX MONCTONIC, CLOCK 
.POSIX MEMORY PROTECTION 
.POSIX MESSAGE PASSING 


.POSIX PRIORITIZED. IO 

.POSIX, PRIORITIZED. SCHEDULING 
.POSIX RAW SOCKETS 

.POSIX REALTIME SIGNALS 
POSIX SEMAPHORES 

.POSIX SHARED MEMORY OBJECTS 
.POSIX SYNCHRONIZED IO 
POSIX. SPIN. LOCKS 

—POSIX SPAWN 

.POSIX SPORADIC SERVER 
.POSIX. THREAD CPUTIME 

.POSIX TRACE EVENT FILTER 
.POSIX THREADS 

.POSIX TIMEOUTS 

. POSIX TIMERS 
—POSIX, THREAD PRIO. INHERIT 
.POSIX THREAD, PRIO, PROTECT 
—POSIX THREAD PRIORITY SCHEDULING 
.POSIX TRACE 

.POSIX TRACE INHERIT 

.POSIX TRACE. LOG 

.POSIX THREAD ATTR STACKADDR 
—POSIX THREAD, SAFE, FUNCTIONS 
—POSIX THREAD PROCESS SHARED 
.POSIX THREAD SPORADIC SERVER 


.POSIX THREAD ATTR STACKSIZE 
.POSIX TYPED MEMORY, OBJECTS 
—XOPEN, UNIX 

.XOPEN STREAMS 


| 存储 映射 的 文件 | 
进程 存储 区 加 锁 (实时 ) 
存储 区 域 加 锁 (实时 ) 
单调 时 钟 (实时 ) 

存储 保护 
消息 传送 (实时) 

IEC 60559 浮 点 选项 
优先 输入 和 输出 
进程 调度 (实时) 
原始 套 接 字 

实时 信号 扩展 
信号 量 (实时 ) 
共享 存储 对 象 (实时 ) 
同步 输入 和 输出 (实时) 
自 旋 锁 (实时 ) 

产生 (实时 ) 

进程 散发 性 服务 器 (实时 ) 
线程 CPU 时 钟 (实时 ) 
跟踪 事件 过 滤器 

线程 

超时 (实时 ) 
计时 器 (实时 ) 

线程 优先 级 继承 (实时 ) 
线程 优先 级 保护 (实时) 
线程 执行 调度 (实时) 
跟踪 

跟踪 继承 

跟踪 日 志 
线程 栈 地 址 属性 
线程 安全 的 函数 
线程 进程 共享 的 同步 
线程 散发 性 服务 器 (实时 ) 
线程 栈 地 址 大 小 

类 型 化 的 存储 对 象 (RH) 
X/Open 扩展 接口 

XSI STREAMS 








POSIX.1 没 有 包括 超级 用 户 (superuser) 这 样 的 概念 ， 代 之 以 规定 某 些 操作 要 求 “ 适 当 的 特 
权 ”，POSIX.1 将 此 术语 的 定义 留 由 其 体 实 现 进行 解释 。 某 些 符 合 美国 国防 部 安全 性 指南 的 UNIX 
系统 上 共有 很 多 不 同 的 安全 级 。 本 书 仍 使 用 传统 的 UNIX 术 语 ， 并 指明 要 求 超级 用 户 特权 的 操作 。 

经 过 近 20 年 的 工作 ， 相 关 标 准 已 经 成 熟 稳定 。POSIX.1 标 准 现 由 称 为 Austin Group 
(http: //www.opengroup.org/austin) 的 开放 工作 组 维护 。 为 了 保证 它们 与 实际 需求 吻 
合 ， 仍 需 经 常 对 这 些 标准 进行 更 新 或 再 修订 。 
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2.2.3 Single UNIX Specification 


Single UNIX Specification (单一 UNIX 规 范 ) 是 POSIX.1 标 准 的 一 个 超 集 ， 定 义 了 一 些 附加 
的 接口 ， 这 些 接口 扩展 了 基本 的 POSIX.1 规 范 所 提供 的 功能 。 相 应 的 系统 接口 全 集 被 称 为 
X/Open £ %4# v. (XSI, X/Open System Interface)。__XOPEN_UNIX 符 号 常量 标识 了 (相对 于 
基本 POSIX.1 接 口 而 言 ) XSI 扩 展 的 接口 。 

XSI 还 定义 了 实现 必须 支持 POSIX.1 的 哪些 可 选 部 分 才能 认为 是 遵循 XSI (XSI conforming) 
的 。 它 们 包括 文件 同步 、 存 储 映射 文件 、 存 储 保护 及 线程 接口 ， 并 在 表 2-5 中 标明 是 “SUS 强 制 
要 求 "。 只 有 遵循 XSI 的 实现 才能 称 为 UNIX 系 统 。 





Open Group 拥有 UNIX 商 标 ， 并 且 使 用 Single UNIX Specification 来 定义 一 个 实现 必须 支持 的 接口 ， 
这 样 的 实现 才能 称 为 UNIX 系 统 。 实 现 必须 以 文件 形式 提供 符合 性 声明 ， 并 通过 验证 符合 性 的 测试 包 测 
试 ， 以 及 得 到 使 用 UNIX 商 标的 许可 。 


在 XSI 中 定义 的 某 些 附 加 的 接口 是 必需 的 ， 其 他 的 则 是 可 选 的。 依据 常用 的 功能 ， 接 口 被 
分 成 如 下 若干 选项 组 (option group) : 

。 加密: 由 符号 常量 XOPEN_CRYPE 标 记 。 

。 实 时 : 由 符号 常量 _XOPEN_REALTIME 标 记 。 

。 高 级 实时 。 

。 实 时 线程 ， 由 符号 常量 _XOPEN_REALTIME_THREADS 标 记 。 

* 高 级 实时 线程 。 

"跟踪 。 

* XSI STREAMS (ifi): 由 符号 常量 _XOPEN_STRERAMS 标 记 。 

* 遗留 接口 : 由 符号 常量 _XOPEN_LEGACY 标 记 。 

Single UNIX Specification (SUS) 由 Open Group 发 布 ，Open Group 成 立 于 1996 年 ， 由 两 个 
业界 社团 X/Open 和 Open Software Foundation (OSF) 合并 而 成 。X/Open 过 去 一 直 在 出 版 
X/Open Portability Guide (X/Open 可 移植 性 指南 )， 它 采用 了 若干 特定 标准 ， 填 补 了 其 他 标准 缺 
失 功 能 的 空白 。 这 些 指南 的 目的 是 改善 应 用 程序 的 可 移植 性 ， 使 其 不 仅仅 符合 已 出 版 的 标准 。 

Single UNIX Specification 的 第 一 个 版 本 由 X/Open 在 1994 年 出 版 ， 因 为 它 大 约 包 含 了 1170 
个 接口 ， 因 此 也 被 称 为 “Spec 1170”。 它 源 自 Common Open Software Environment (COSE) 的 
倡议 ， 该 倡议 的 目标 是 进一步 改善 应 用 程序 在 所 有 UNIX 操 作 系 统 实现 之 间 的 可 移植 性 。COSE 
组 的 成 员 包括 Sun、IBM、HP、NovelVUSL 以 及 OSF， 该 组 织 较 之 仅仅 支持 标准 前 进 了 一 大 步 。 
此 外 ， 他 们 调查 了 若干 常见 的 商业 应 用 程序 所 使 用 的 接口 ， 并 从 中 选 出 了 1170 个 接口 。 这 些 接 
口 也 包括 在 下 列 各 标准 中 : X/Open Common Application Environment (CAE) 第 4 发 行 版 ( 称 为 
XPG4， 以 表示 它 与 其 前 身 X/Open Portability Guide 的 历史 关系 )、System V Interface Definition 
(SVID， 系 统 V 接 口 定 义 ) 第 3 版 、Level 1 接口 、OSF Application Environment Specification 
(AES) Full Use 接口 。 

Single UNIX Specification 第 2 版 由 Open Group 在 1997 年 出 版 。 新 版 本 增加 了 对 一 些 功能 的 
支持 ， 包 括 线程 、 实 时 接口 、64 位 处 理 、 大 文件 以 及 增强 的 多 字 节 字符 处 理 等 。 

Single UNIX Specification 第 3 版 (简写 为 SUS v3) 由 Open Group 在 2001 年 出 版 。SUS v3 的 
基本 规范 与 IEEE 标 准 1003.1-2001 相 同 ， 分 成 4 部 分 : 基本 定义 、 系 统 接 口 、Shell 和 实用 程序 以 


bbs.theithome.com 


28 
31 








26 X 2x UNIX 标准 化 及 实现 


及 基本 理论 。SUS v3 还 包括 X/Open Curses Issue 4 第 2 版 ， 但 该 规范 并 不 是 POSIX.1 的 组 成 部 分 。 

2002 年 ，ISO 将 该 版 本 批准 为 国际 标准 ISO/IEC 9945:2002, Open Group 在 2003 年 再 次 更 新 
了 1003.1 标 准 ， 使 其 包括 了 技术 方面 的 更 正 ，ISO 将 其 批准 为 国际 标准 ISO/IEC 9945:2003。 
2004 年 4 月 ，Open Group 出 版 了 Single UNIX Specification 第 3 版 ，2004 版 本 。 它 包括 了 对 标准 主 
要 正文 更 多 在 技术 上 的 更 正 。 


2.2.4 FIPS 


FIPS 的 含义 是 联邦 信息 处 理 标准 (Federal Information Processing Standard)。 它 由 美国 政府 
出 版 ， 用 于 计算 机 系统 的 采购 。FIPS 151-1 (1989 年 4 月 ) 基于 IEEE 标 准 1003.1-1988 及 ANSI C 
标准 草案 。 此 后 是 FIPS 151-2 (1993 年 5 月 ) ， 它 基于 IEEE 标 准 1003.1-1990。 某 些 在 POSIX.1 中 
列 为 可 选 的 功能 ， 在 FIPS 151-2 中 是 必需 的 。 所 有 这 些 可 选 功 能 在 POSIX.1-2001 中 已 成 为 强制 

POSIX.1 FIPS 的 影响 是 ， 它 要 求 任何 希望 向 美国 政府 销售 POSIX.1 兼 容 的 计算 机 系统 的 厂 
商 应 支持 POSIX.1 的 其 些 可 人选 功能 。 因 为 POSIX.1 FIPS 的 影响 正 逐 步 减退 ， 所 以 在 本 书 中 我 们 
将 不 再 进一步 考虑 它 。 


2.3 UNIX 系统 实现 


上 一 节 描 述 了 由 各 自 独立 的 组 织 所 制定 的 三 个 标准 :; ISOC, IEEE POSIX 以 及 Single UNIX 
Specification。 但 是 ， 标 准 只 是 接口 的 规范 。 这 些 标准 是 如 何 与 现实 世界 相关 联 的 呢 ?” 这 些 标 
准 由 制造 商 采用 ， 然 后 转变 成 具体 实现 。 本 书 中 我 们 感 兴趣 的 是 这 些 标准 和 它们 的 具体 实现 。 

在 McKusick 等 [1996] 的 1.1 节 中 给 出 了 UNIX 系 统 家 族 树 的 详细 历史 (还 有 很 好 的 一 幅 图 片 )。 
UNIX 的 各 种 版 本 和 变 体 都 起 源 于 在 PDP-11 系 统 上 运行 的 UNIX 分 时 系统 第 6 版 ‘1976 年) 和 第 7 
版 (1979 年 ) (通常 称 为 V6 和 V7)。 这 两 个 版 本 是 在 贝尔 实验 室 以 外 首先 得 到 广泛 应 用 的 UNIX 
系统 。 从 树 上 演变 出 三 个 分 支 ; 

(1) AT&T 分 支 ， 从 此 导出 了 系统 三 和 系统 V (被 称 为 UNIX 的 商用 版 本 )。 

(2) 加 州 大 学 伯克利 分 校 分 支 ， 从 此 导出 4.xBSD 实 现 。 

(3) 由 AT&T 贝 尔 实验 室 的 计算 科学 研究 中 心 开发 的 UNIX 研 究 版 本 ， 从 此 导出 UNIX 分 时 系 
统 第 8、 第 9 版 以 及 于 1990 年 发 布 的 最 后 一 版 第 10 版 。 


2.3.1 SVR4 


SVR4 (UNIX System V Release 4，UNIX 系 统 V 第 4 版 ) 是 AT&T 的 UNIX 系 统 实验 室 (USL, 
其 前 身 是 AT&T 的 UNIX Software Operation) 的 产品 。 它 将 下 列 系统 的 功能 合并 到 一 个 一 致 的 
操作 系统 中 : AT&T 的 UNIX 系 统 V 第 3.2 版 (SVR3.2), Sun Microsystems 公 司 的 SunOS 操 作 系 统 、 
加 州 大 学 伯克利 分 校 的 4.3BSD 版 本 以 及 微软 的 Xenix 系 统 (Xenix 是 在 V7 的 基础 上 开发 的 ， 后 
来 又 采用 了 很 多 系统 V 的 功能 ) 。 其 源 代 码 于 1989 年 后 期 发 布 , 并 在 1990 年 开始 向 终端 用 户 提供 。 
SVR4 符 合 POSIX 1003.1 标 准 和 X/Open Portability Guide 第 3 版 (XPG3) 标准 。 

AT&T 也 出 版 了 系统 V 接 口 定 义 (SVID) [AT&T 1989]。SVID 第 3 版 说 明了 UNIX 系 统 要 达 
到 SVR4 质 量 要 求 所 应 提供 的 功能 。 如 同 POSIX.1 一 样 ，SVID 定 义 了 一 个 接口 ， 而 不 是 一 种 实 
现 。SVID 并 不 区 分 系统 调用 和 库 函 数 。 对 于 一 个 SVR4 的 具体 实现 ， 应 查看 其 参考 手册 ， 以 了 
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解 系 统 调 用 和 库 函 数 的 不 同 之 处 [AT&T 1990e]。 
2.3.2 4.4BSD 


BSD (Berkeley Software Distribution) 版 是 由 加 州 大 学 伯克利 分 校 的 计算 机 系统 研究 组 
(CSRG) 研究 开发 和 分 发 的 。4.2BSD 于 1983 年 问世 ，4.3BSD 则 于 1986 年 发 布 。 这 两 个 版 本 都 
在 VAX 小 型 机 上 运行 。 它 们 的 下 一 个 版 本 4.3BSD Tahoe 于 1988 年 发 布 ， 在 一 台 称 为 Tahoe 的 小 
型 机 上 运行 (Leffler 等 [1989] 说 明了 4.3BSD Tahoe 版 ) 。 其 后 又 有 1990 年 的 4.3BSD Reno 版 ， 它 
支持 很 多 POSIX.1 的 功能 。 

最 初 的 BSD 系 统 包 含 了 AT&T 专 有 的 源 代 码 ， 并 需要 AT&T 许 可 证 。 为 了 获得 BSD 系 统 的 
源 代 码 ， 首 先 需要 持 有 AT&T 的 UNIX 源 代码 许可 证 。 这 种 情况 正在 得 到 改变 ， 近 几 年 来 ， 愈 
来 愈 多 的 AT&T 源 代码 被 替换 成 非 AT&T 源 代码 ， 很 多 加 到 BSD 系 统 上 的 新 功能 也 来 自 于 非 
AT&T 方 面 。 

1989 年 ， 伯 克利 分 校 的 计算 机 系统 研究 组 将 4.3BSD Tahoe 中 很 多 非 AT&T 源 代码 包装 成 
BSD 网 络 软 件 1.0 版 ， 并 使 其 成 为 可 公开 得 到 的 软件 。 其 后 则 有 BSD 网 络 软 件 2.0 版 (1991)， 它 
是 从 4.3BSD Reno 版 派生 出 来 的 ， 其 目的 是 使 大 部 分 (如 果 不 是 全 部 的 话 ) 4.4BSD 系 统 不 再 受 
AT&T 许 可 证 的 限制 ， 这 样 ， 大 家 都 可 以 得 到 源 代码 。 

4.4BSD-Lite 是 CSRG 期 望 开 发 的 最 后 一 个 版 本 。 由 于 与 USL 产 生 了 法 律 纠纷 ， 该 版 本 曾 一 
度 延 迟 推出 。 在 纠纷 解决 后 ，4.4BSD-Lite 立 即 于 1994 年 发 布 ， 并 且 不 再 需要 UNIX 源 代码 使 用 
许可 证 就 可 以 使 用 它 。1995 年 CSRG 发 布 排除 了 故障 的 版 本 。4.4BSD-Lite 第 2 版 是 CSRG 的 最 后 
一 个 BSD 版 本 (McKusick 等 [1996] 描 述 了 该 BSD 版 本 )。 

在 伯克利 所 进行 的 UNIX 开 发 工作 是 从 PDP-11 开 始 的 ， 然 后 转移 到 VAX 小 型 机 上 ， 接 着 又 
转移 到 工作 站 上 。20 世 纪 90 年 代 早 期 ， 伯 克利 得 到 支持 ， 在 广泛 应 用 的 80386 个 人 计算 机 上 开 
发 BSD 版 本 ， 结 果 产 生 了 386BSD。 这 一 工作 是 由 Bill Jolitz 完 成 的 。 其 相关 文档 发 表 在 1991 年 
Dr.Dobb Journal} (每 月 一 篇 的 系列 文章 ) 。 其 中 很 多 代码 出 现在 BSD 网 络 软件 2.0 版 中 。 


2.3.3 FreeBSD 


FreeBSD 的 基础 是 4.4BSD-Lite 操 作 系统 。 在 加 州 大 学 伯克利 分 校 的 CSRG 决 定 终止 其 在 
UNIX 操 作 系 统 的 BSD 版 本 上 的 研发 工作 后 ,并 且 386BSD 项 目 看 起 来 似乎 被 忽视 了 太 长 的 时 间 ， 
为 了 继续 坚持 BSD 系 列 ， 设 立 了 FreeBSD 项 目 。 

由 FreeBSD 项 目 产生 的 所 有 软件 (包括 其 二 进 制 代码 和 源 代码 ) 都 是 免费 使 用 的 。 为 了 测 
试 本 书 中 的 实例 采用 了 4 个 系统 ，FreeBSD 5.2.1 操 作 系 统 是 其 中 的 一 个 。 


还 有 其 他 几 个 基于 BSD 的 免费 操作 系统 。NetBSD 项 目 (http://www.netbsd.org) RMF 
FreeBSD 项 目 ， 但 是 更 注重 不 同 硬件 平台 之 韶 的 可 移植 性 。OpenBSD 项 目 (http://www.openbsd. 
org) 也 类 似 于 FreeBSD 项 目 ， 但 更 注重 安全 性 。 


2.3.4 Linux 


Linux 是 一 种 提供 丰富 的 UNIX 编 程 环境 的 操作 系统 ， 在 GNU 公 用 许可 证 指导 下 ，Linux 是 
免费 使 用 的 。Linux 的 普及 是 计算 机 产业 中 一 道 亮 丽 的 风景 线 。Linux 经 常 是 支持 新 硬件 的 第 一 
个 操作 系统 ， 这 一 点 使 其 3 引 人 注 目 。 
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Linux 是 由 Linus Torvalds 在 1991 年 为 替代 MINIX 而 研发 的 。 一 位 当时 名 不 见 经 传人 物 的 努 
De T BRER, RT BHASHRHRSKEARSE, BATRA NARA [8] 2e fl 
用 和 不 断 地 增强 Linux。 

Linux 的 Mandrake 9.2 分 发 版 是 用 以 测试 本 书 实例 的 操作 系统 之 一 。 该 系统 使 用 了 Linux 操 
作 系 统 内核 2.4.22 版 。 


2.3.5 Mac OS X 


与 其 以 前 的 版 本 相 比 ，Mac OS X 使 用 了 完全 不 同 的 技术 。 其 核心 操作 系统 被 称 为 Darwin， 
它 基 于 Mach 内 核 (Accetta 等 [1986]) 和 FreeBSD 操 作 系 统 的 组 合 。 类 似 于 FreeBSD 和 Linux， 
Darwin 是 一 个 开放 源 代码 项 目 。 

Mac OS X 10.3h (Darwin 7.4.0) 是 用 以 测试 本 书 实例 的 操作 系统 之 一 。 


2.3.6 Solaris 


Solaris 是 由 Sun 公 司 开发 的 UNIX 系 统 版 本 。 它 基于 SVR4， 并 在 10 余 年 闻 由 Sun 公 司 的 工程 
师 对 其 进行 了 不 断 的 增强 。 它 是 唯一 在 商业 上 取得 成 功 的 SVR4 后 裔 ， 并 被 正式 验证 为 UNIX 系 
统 。( 关 于 UNIX 验 证 的 更 多 信息 ， 请 参见 http : //www.opengroup .org/ certification/ 
idx/unix.html,) 

Solaris 9 UNIX 操 作 系 统 也 是 用 以 测试 本 书 实例 的 操作 系统 之 一 。 


2.3.7 其 他 UNIX 系 统 


已 经 通过 验证 的 其 他 UNIX 系 统 的 版 本 包括 : 

* AIX，IBM 版 的 UNIX 系 统 。 

。HP-UX，HP 版 的 UNIX 系 统 。 

° IRIX, Silicon Graphics 版 的 UNIX 系 统 。 

* Unix Ware，SVR4 派 生 的 UNIX 系 统 ， 现 由 SCO 销 售 。 


2.4 标准 和 实现 的 关系 


前 面 提 到 的 各 个 标准 定义 了 任 一 实际 系统 的 子 集 。 本 书 主要 关注 4 种 实际 的 UNIX 系 统 ; 
FreeBSD 5.2.1, Linux 2.4.22, Mac OS X 10.3 和 Solaris 9。 在 这 4 种 系统 中 ， 虽 然 只 有 Solaris 9 能 
够 称 自己 是 一 种 UNIX 系 统 ， 但 是 所 有 这 4 种 系统 都 提供 UNIX 编 程 环境 。 因 为 所 有 这 4 种 系统 都 
在 不 同 程度 上 依从 POSIX， 所 以 我 们 也 将 重点 关注 POSIX.1 标 准 所 要 求 的 功能 ， 并 指出 这 4 种 系 
统 的 具体 实现 与 POSIX 之 间 的 差别 。 仅 仅 一 个 特定 实现 所 特有 的 功能 和 例 程 会 被 清楚 地 标记 出 
来 。 因 为 SUS v3 是 POSIX.1 的 超 集 ， 所 以 我 们 还 叙述 了 属于 SUS v3 但 不 属于 POSIX.1 的 功能 。 

应 当 了 解 ， 这 些 实现 都 提供 了 对 它们 早期 版 本 (例如 SVR3.2 和 4.3BSD) 功能 的 向 后 兼容 
性 。 例 如 ，Solaris 对 POSIX 规 范 中 的 非 阻塞 IO (0_NONBLOCK) 以 及 传统 的 系统 V 方 法 
(0 NDELAY) 都 提供 了 支持 。 本 书 将 只 使 用 POSIX.1 的 功能 ， 但 是 也 会 提 及 它 所 替代 的 是 哪 一 
种 非 标准 功能 。 与 此 相 类 似 ，SVR3.2 和 4.3BSD 以 某 种 有 别 于 POSIX.1 标 准 的 方法 提供 了 可 靠 的 
信号 机 制 。 第 10 章 将 只 说 明 POSIX.1 的 信号 机 制 。 
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2.5 限制 


UNIX 系 统 实现 定义 了 很 多 幻 数 和 常量 ， 其 中 有 很 多 已 被 硬 编码 进程 序 中 ， 或 用 特定 的 技 
术 确 定 。 由 于 大 量 标 准 化 工作 的 努力 ， 已 有 若干 种 可 移植 的 方法 用 以 确定 这 些 幻 数 和 实现 定义 
的 限制 。 这 非常 有 助 于 软件 的 可 移植 性 。 

以 下 两 种 类 型 的 限制 是 必需 的 ; 

(1) 编译 时 限制 〈 例 如 ， 短 整 型 的 最 大 值 是 什么 ? ) 。 

(2) 运行 时 限制 (例如 ， 文 件 名 可 以 有 多 少 个 字符 ?)。 

编译 时 限制 可 在 头 文件 中 定义 ， 程 序 在 编译 时 可 以 包含 这 些 头 文件 。 但 是 ， 运 行 时 限制 则 
要 求 进程 调用 一 个 函数 以 获得 此 种 限制 值 。 

另外 ， 某 些 限制 在 一 个 给 定 的 实现 中 可 能 是 固定 的 (因此 可 以 静态 地 在 一 个 头 文件 中 定义 )， 
而 在 另 一 个 实现 上 则 可 能 是 变化 的 (需要 有 一 个 运行 时 函数 调用 )。 这 类 限制 的 一 个 例子 是 文 
件 名 的 最 大 字符 数 。SVR4 之 前 的 系统 V 由 于 历史 原因 只 允许 文件 名 最 多 包含 14 个 字符 ， 而 源 于 
BSD 的 系统 则 将 此 增加 到 255。 目 前 ， 大 多 数 UNIX 系 统 支持 多 文件 系统 类 型 ， 而 每 一 种 类 型 有 
它 自己 的 限制 。 文 件 名 的 最 大 长 度 依赖 于 该 文件 处 于 何 种 文件 系统 中 ， 例 如 ， 根 文件 系统 中 的 
文件 名 长 度 限制 可 能 是 14 个 字符 ， 而 在 另 一 个 文件 系统 中 文件 名 长 度 限制 可 能 是 255 个 字符 ， 
这 是 运行 时 限制 的 一 个 例子 。 

为 了 解决 这 类 问题 ， 提 供 了 以 下 三 种 限制 : 

(1) 编译 时 限制 ( 头 文件 )。 

(2) 不 与 文件 或 目录 相关 联 的 运行 时 限制 (sysconf 函 数 )。 

(3) 与 文件 或 目录 相关 联 的 运行 时 限制 (pathconf 和 fpathconf 函 数 )。 

使 事情 变 得 更 加 复杂 的 是 ， 如 果 一 个 特定 的 运行 时 限制 在 一 个 给 定 的 系统 上 并 不 改变 ， 则 
可 将 其 静态 地 定义 在 一 个 头 文件 中 。 但 是 ， 如 果 没 有 将 其 定义 在 头 文件 中 ， 则 应 用 程序 就 必须 
调用 三 个 conf 函数 中 的 一 个 (我 们 很 快 就 会 对 它们 进行 说 明 ) ， 以 确定 其 运行 时 的 值 。 


2.5.1 ISO C 限 制 


ISO C 定 义 的 限制 都 是 编译 时 限制 。 表 2-6 列 出 了 文件 <1imits .h> 中 定义 的 C 标 准 限制 。 
这 些 常量 总 是 定义 在 头 文件 中 ， 而 且 在 一 个 给 定 系统 中 不 会 改变 。 第 3 列 列 出 了 ISO C 标 准 可 接 
受 的 最 小 值 。 这 用 于 16 位 整 型 系统 ， 使 用 1 的 补 码 表示 。 第 4 列 列 出 了 一 个 32 位 整 型 Linux 系 统 
的 值 ， 用 2 的 补 码 表示 。 注 意 ， 对 不 带 符号 的 数据 类 型 都 没有 列 出 其 最 小 值 ， 它 们 都 应 为 0。 在 
64 位 系统 中 ， 其 1ong 整 型 的 最 大 值 与 表 中 1ong Long 整 型 最 大 值 相 匹配 。 

我 们 将 会 遇 到 的 一 个 不 同 之 处 是 系统 是 否 提供 带 符号 或 不 带 符号 的 字符 值 。 从 表 2-6 的 第 4 
列 可 以 看 出 ， 该 特定 系统 使 用 了 带 符号 字符 。 从 表 中 可 以 看 到 CHAR_MIN 等 于 SCHRAR_MIN， 
CHAR_MAX 等 于 SCHAR_MAX。 如 果 系 统 使 用 不 带 符号 的 字符 ， 则 CHAR_MIN 等 于 0， 
CHAR, MAXA&-FUCHAR MAX, 

在 头 文件 <float .h> 中 ， 对 浮 点 数据 类 型 也 有 类 似 的 一 组 定义 。 如 果 读 者 在 工作 中 涉及 
大 量 浮 点 数据 类 型 ， 则 应 仔细 查看 该 文件 。 

我 们 会 遇 到 的 另 一 个 ISO C 常 量 是 FOPEN_MAX， 这 是 具体 实现 保证 可 同时 打开 的 标准 LO 流 
的 最 小 数 。 该 值 在 头 文件 <stdaio.h> 中 定义 ， 其 最 小 值 是 gs。POSIX.1 中 的 STREAM_MAX (车 
定义 的 话 ) 必须 具有 与 FOPEN_MAX 相 同 的 值 。 
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表 2-6 <1limite.h> 中 定义 的 整 型 值 大 小 


BATH 


CHAR BIT 字符 的 位 数 à 
CHAR MAX 字符 的 最 大 值 127 
CHAR_MIN 字符 的 最 小 值 2B 
SCHAR_MAX 带 符号 字符 的 最 大 值 127 
SCHAR_MIN 带 符号 字符 的 最 小 值 —128 
UCHAR_MAX 不 带 符号 字符 的 最 大 值 235 
整 型 的 最 大 值 2 147 483 647 
整 型 的 最 小 值 —2 147 483 648 
不 带 符号 整 型 的 最 大 值 Sees 
SHRT_MIN 短 整 型 的 最 小 值 

SHRT_MAX 短 整 型 的 最 大 值 

USHRT_MAX 不 带 符号 短 整 型 的 最 大 值 
长 整 型 的 最 大 值 

长 整 型 的 最 小 值 

不 带 符号 长 整 型 的 最 大 值 
长 长 整 型 的 最 大 值 














































INT_MAX 















INT_MIN 





UINT_MAX 











LONG_MAX 
LONG_MIN 


2 147 483 647 2 147 483 647 
—2 147 483 647 —2 147 483 648 
4 294 967 295 4 294 967 295 












ULONG MAX 








LLONG MAX 
LLONG. MIN 


9 223 372 036 854 775 807 
长 长 整 型 的 最 小 值 —9 223 372 036 854 775 807 
ULLONG. MAX 不 带 符 号 长 长 整 型 的 最 大 值 18 446 744 073 709 551 615 


[misce | NR | T] 
ISO Cf£«stdio.hsrpyB4E X T Æ CTMP MAX, XE M tmpnam UT ^E RORE — WZ 


最 大 数 。 关 于 此 常量 我 们 将 在 5.13 节 中 进行 更 多 说 明 。 
在 表 2-7 中 ， 我 们 列 出 了 本 书 所 讨论 的 四 种 平台 上 的 FOPEN_MAX 和 TMP_MAX 值 。 


9 223 372 036 854 775 807 
—9 223 372 036 854 775 808 
18 446 744 073 709 551 615 














R27 在 各 种 平台 上 的 ISO 限 制 





ISO C 还 定义 了 常量 FTLENRAME MAX， 因 为 某 些 操作 系统 实现 在 历史 上 将 它 定 义 得 太 小 ， 以 至 于 不 
能 满足 应 用 的 需求 ， 所 以 我 们 应 避免 使 用 该 常量 。 


2.5.2 POSIX 限 制 


POSIX.1 定 义 了 很 多 涉及 操作 系统 实现 限制 的 常量 ， 不 幸 的 是 ， 这 是 POSIX.1 中 最 令 人 迷惑 
不 解 的 部 分 之 一 。 虽 然 POSIX.1 定 义 了 大 量 的 限制 和 常量 ， 我 们 只 关心 与 基本 POSIX.1 接 口 有 关 


的 部 分 。 这 些 限制 和 常量 被 分 成 下 列 5 类 。 


(1) 不 变 的 最 小 值 ， 表 2-8 中 的 19 个 常量 。 
(2) 不 变 值 : SSIZE MAX, 
(3) 运行 时 可 以 增加 的 值 : CHARCLASS NAME MAX, COLL WEIGHTS MAX, LINE. 
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MAX, NGROUPS MAXLL 有 RE_DUP_MAX, 

(4) 运行 时 不 变 的 值 (可 能 不 确定 ): ARG MAX, CHILD, MAX, HOST NAME MAX, 
LOGIN NAME MAX, OPEN MAX, PAGESIZE, RE, DUP MAX, STREAM, MAXS, 
SYMLOOP MAX, TTY NAME MAX[AATZNAME MAX, 

(5) BEA WBA (可 能 不 确定 ): FILESIZEBITS, LINK MAX, MAX, CANON, 
MAX INPUT, NAME MAX, PATH MAX, PIPE BUFLAARSYMLINK, MAX, 


X2-8 <lLimite.h> 中 的 POSIX.1 不 变 最 小 值 


_POSIX_ARG_MAX execth fi) Z fc K nx 
. POSIX, CHILD, MAX 每 个 实际 用 户 ID 的 子 进程 数 
_POSIX_HOST_NAME_MAX gethostname 国 数 返 回 的 主机 名 最 大 长 度 
_POSIX_LINK_MAX 指向 一 个 文件 的 链接 数 
_POSIX_LOGIN_NAME_MAX 登录 名 的 最 大 长 度 
_POSIX_MAX_CANON 终端 规范 输入 队列 的 字 节 数 
_POSIX_MAX_INPUT 终端 输入 队列 的 可 用 空间 
_POSIX_NAME_MAX 文件 名 中 的 字 节 数 ， 不 包括 终止 字符 null 
_POSIX_NGROUPS_MAX 每 个 进程 同时 的 添加 组 ID 数 
_POSIX_OPEN_MAX 每 个 进程 的 打开 文件 数 
_POSIX_PATH_MAX Mee PHS PR, mA EFR nul 
_POSIX_PIPE_BUF 能 原子 地 写 到 管道 的 字 节 数 
_POSIX_RE_DUP_MAX 当 使 用 间隔 表示 法 \{m,n\} 时 ，regexec 和 
regcomp rl iF HE A EM SGA BIRR 
_POSIX_SSIZE_MAX 能 存储 在 ssize_t 对 象 中 的 值 
—POSIX STREAM MAX -个 进程 能 同时 打开 的 标准 VOTER 
_POSIX_SYMLINK_MAX 符号 链接 中 的 字 节 数 
_POSIX_SYMLOOP_MAX 在 解析 路 径 名 时 ， 可 遍历 的 符号 链接 数 
_POSIX_TTY_NAME_MAX 终端 设备 名 长 度 ， 包 括 终止 字符 null 
_POSIX_TZNAME_MAX 时 区 名 字 节 数 





在 这 44 个 限制 和 常量 中 ， 有 一 些 可 定义 在 <limits .h> 中 ， 其 余 的 则 按 具 体 条 件 可 定义 或 
REM. TE2.5.A s Pik Hsysconf, pathconffüfpathconfERZEE, 我们 将 描述 可 定义 或 
不 定义 的 限制 和 常量 。 在 表 2-8 中 ， 我 们 列 出 了 19 个 不 变 最 小 值 。 

这 些 值 是 不 变 的 一 一 它们 并 不 随 系统 而 改变 。 它 们 指定 了 这 些 特征 最 具 约 束 性 的 值 。 一 -个 
符合 POSIX.1 的 实现 应 当 提 供 至 少 这 样 大 的 值 。 这 就 是 为 什么 将 它们 称 为 最 小 值 的 原因 ， 虽 然 
它们 的 名 字 都 包含 了 MAX。 另 外 ， 为 了 保证 可 移植 性 ， 一 个 严格 遵循 POSIX 的 应 用 程序 不 应 要 
求 更 大 的 值 。 我 们 将 在 本 书 的 适当 部 分 说 明 每 一 个 常量 的 含义 。 


一 个 严格 遵 入 (strictly conforming) POSIX t) & M 424-4 A| 3-4: 3 POSIX (merely POSIX 
Confirming) 的 应 用 程序 。 一 个 遵循 POSIX 的 应 用 程序 只 使 用 在 IEEE 标 准 1003.1-2001 中 定义 的 接口 。 
一 个 严格 遵循 的 应 用 程序 也 是 遵 衢 POSIX 的 ， 但 除 此 之 外 它 还 应 不 依赖 于 POSIX 未 定义 的 行为 ， 不 使 
用 任何 已 废弃 的 接口 ， 以 及 不 要 求 所 使 用 的 常量 值 大 于 表 2-8 中 所 列 出 的 最 小 值 。 


不 幸 的 是 ， 这 些 不 变 最 小 值 中 的 某 一 些 在 实际 应 用 中 太 小 了 。 例 如 ， 目 前 在 大 多 数 UNIX 
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系统 中 ， 每 个 进程 可 同时 打开 的 文件 数 远 远 超过 20。 另 外 ，_PoSsIX_PATH_MAX 的 最 小 限制 值 
为 255， 这 也 太 小 了 ， 路 径 名 可 能 会 超过 这 一 限制 。 这 意味 着 在 编译 时 不 能 使 用 _POSIX_ 
OPEN_MAX 和 _POSIX_PATH_MAX 这 两 个 常量 作为 数组 长 度 。 

表 2-8 中 的 每 一 个 不 变 最 小 值 都 有 一 个 相关 的 实现 值 ， 其 名 字 是 将 表 2-8 中 的 名 字 删 除 前 组 
_POSIX_ 后 构成 的 。 不 带 有 前 导 _POSIX_ 的 名 称 打 算 作 为 给 定 实现 支持 的 实际 值 (这 19 个 实现 
值 是 本 节 开 始 部 分 所 列 出 的 2~ 5 项 ， 不 变 值 、 和 运行 时 可 增加 的 值 、 运 行 时 不 变 的 值 、 以 及 路 径 
名 可 变 值 )。 问 题 是 并 不 能 确保 所 有 这 19 个 实现 值 都 在 <LIimits .nh> 头 文件 中 定义 。 

例如 ， 某 个 特定 值 可 能 不 在 此 头 文件 中 定义 ， 其 理由 是 : 一 个 给 定 进程 的 实际 值 可 能 依赖 
于 系统 的 存储 总 量 。 如 果 没 有 在 头 文件 中 定义 这 些 值 ， 则 不 能 在 编译 时 使 用 它们 作为 数组 边界 。 
所 以 ，POSIX.1 提 供 了 三 个 运行 时 函数 以 供 调 用 ， 它 们 是 : sysconf、pathconf 以 及 
fpathconf, 使 用 这 三 个 函数 可 以 在 运行 时 得 到 实际 的 实现 值 。 但 是 ， 还 有 一 个 问题 ， 其 中 
某 些 值 由 POSIX.1 定 义 为 “可 能 不 确定 的 ”( 逻 辑 上 无 限 的 )， 这 就 意味 着 该 值 没有 实际 上 限 。 
例如 在 Linux 中 ，readv 或 writev 可 用 的 iovec 结 构 数 仅 受 系统 存储 总 量 的 限制 。 所 以 在 
Linux 中 ，IOV_MRAX 被 认为 是 不 确定 的 。2.5.5 节 还 将 讨论 运行 时 限制 不 确定 的 问题 。 


2.5.3 XSI 限 制 


XSI 还 定义 了 处 理 实 现 限制 的 下 面 几 个 常量 : 

(1) 不 变 最 小 值 : 表 2-9 中 列 出 的 10 个 常量 。 

(2) 数值 限制 ， LONG_BIT 和 WORD_BIT。 

(3) 运行 时 不 变 值 (AREA): ATEXIT MAX, IOV_MAXLJ RR PAGE, SIZE, 
不 变 最 小 值 列 示 于 表 2-9 中 ， 在 这 些 值 中 ， 很 多 与 消息 类 有 关 。 最 后 两 个 常量 值 例 证 了 POSIX.1 
最 小 值 太 小 的 情况 ， 根 据 推 测 这 可 能 是 考虑 到 了 找 入 式 POSIX.1 实 现 。 为 此 ，Single UNIX 
Specification 为 遵循 XSI 的 系统 增加 了 具有 较 大 最 小 值 的 符号 。 


表 2-9 <limits.h> 中 的 XSI 不 变 最 小 值 


NL_ARGMAX printf 和 scanf 调 用 中 的 最 大 数字 值 

NL_LANGMAX LANG 环 境 变量 中 的 最 大 字 节 数 

NL_MSGMAX 最 大 消息 数 32 767 
NL_NMAX N 对 1 映射 字符 中 的 最 大 字 节 数 (未 指定 ) 


NL_SETMAX 最 大 集合 数 255 
NL_TEXTMAX 消息 字符 串 中 的 最 大 字 节 数 —POSIX2_LINE_MAX 
NZERO 默认 的 进程 优先 级 

_XOPEN_IOV_MAX readv 或 writev 可 使 用 的 最 大 iovec 结 构 数 

.XOPEN NAME MAX | 文件 名 中 的 字 节 数 

.XOPEN PATH MAX | 路 径 名 中 的 字 节 数 





2.5.4 sysconf, pathconf#ifpathconf mw 


我 们 已 列 出 了 实现 必须 支持 的 各 种 最 小 值 ， 但 是 怎样 才能 找到 一 个 特定 系统 实际 支持 的 限 
制 值 呢 ? 正如 前 面 提 到 的 ， 某 些 限 制 值 在 编译 时 是 可 用 的 ， 而 另外 一 些 则 必须 在 运行 时 确定 。 
我 们 也 曾 提 及 在 一 个 给 定 的 系统 中 某 些 限制 值 是 不 会 更 改 的 ， 而 其 他 限制 值 则 与 文件 和 目录 相 
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关联 ， 是 可 以 改变 的 。 运 行 时 限制 可 通过 调用 下 面 三 个 函数 中 的 一 个 而 取得 。 


#include <unistd.h> 


long sysconf (int name) ; 


long pathconf (const char *pathname, int name); 
long fpathconf (int filedes, int name); 


PARRA: 车 成 功 则 返回 相应 值 ， 若 出 错 则 返回 -1 ( 见 后 ) 





后 两 个 函数 之 间 的 差别 是 一 个 用 路 径 名 作为 其 参数 ， 另 一 个 则 取 文 件 描述 符 作为 参数 。 
表 2-10 中 列 出 了 sysconf 函 数 所 使 用 的 name 参 数 ， 用 于 标识 系统 限制 。 以 _SC_ 开 始 的 常 
量 用 作 标 识 运 行 时 限制 的 sysconf 参 数 。 表 2-11 列 出 了 pathconf 和 fpathconf 函 数 为 标识 


系统 限制 所 使 用 的 name 参 数 。 以 _PC_ 开 始 的 常量 用 作 标 识 运 行 时 限制 的 pathconf 或 


fpathconf 参 数 。 


#2-10 ”sysconf 的 限制 及 name 参 数 


ARG_MAX exec 函 数 的 参数 最 大 长 度 ( 字 节 数 ) _SC_ARG_MAX 
ATEXIT_MAX 可 用 atexit 函 数 登 记 的 最 大 函数 个 数 _SC_ATEXIT_MAX 
CHILD_MAX 每 个 实际 用 户 ID 的 最 大 进程 数 _SC_CHILD_MAX 
clock ticks/second 每 秒 时 钟 滴答 数 _SC_CLK_TCK 
COLL_WEIGHTS_MAX TEAR HE MICE oy LRP LC. COLLATENSUE _SC_COLL_WEIGHTS_MAX 
关键 字 项 的 最 大 权重 数 
HOST_NAME_MAX gethostname 国 数 返 回 的 主机 名 最 大 长 度 _SC_HOST_NAME_MAX 
TOV_MAX readv 或 writev 国 数 可 以 使 用 的 iovec 结 构 _SC_IOV_MAX 
的 最 大 数 
LINE_MAX 实用 程序 输入 行 的 最 大 长 度 _SC_LINE_MAX 
LOGIN_NAME_MAX 登录 名 的 最 大 长 度 _SC_LOGIN_NAME_MAX 
NGROUPS_MAX 每 个 进程 同时 添加 的 最 大 进程 组 ID 数 _SC_NGROUPS_MAX 
OPEN_MAX 每 个 进程 的 最 大 打开 文件 数 _SC_OPEN_MAX 
PAGESIZE 系统 存储 页 长 度 CETTE) _SC_PAGESIZE 
PAGE_SIZE 系统 存储 页 长 度 CEPR) _SC_PAGE_SIZE 
RE_DUP_MAX 当 使 用 间隔 表示 法 \{m,n\} 时 ，regexec 和 _SC_RE_DUP_MAX 
regcomp a fe Vr BUE As YE RU E GA SA BS HL AC 
STREAM MAX 在 任 一 时 刻 每 个 进程 的 最 大 标准 1O 流 数 ， 如 若 定 _SC_STREAM_MAX 
义 ， 则 其 值 一 定 与 FOPEN_MAX 相 同 
SYMLOOP_MAX FERRE SH, Fie SR _SC_SYMLOOP_MAX 
TTY_NAME_MAX 终端 设备 名 长 度 ， 包 括 终止 字符 null _SC_TTY_NAME_MAX 
TZNAME_MAX 时 区 名 的 最 大 字 节 数 _SC_TZNAME_MAX 


我 们 需要 更 详细 地 说 明 这 三 个 函数 的 不 同 返 回 值 。 

(1) 如 果 name 不 是 表 2-10 和 表 2-11 的 第 3 列 中 的 一 个 合适 的 常量 ， 则 所 有 这 三 个 函数 都 会 返 
回 ~1， 并 将 errno 设 置 为 EINVAL。 在 本 书后 续 部 分 都 将 使 用 这 些 限 制 常 量 。 

(2) 有 些 name 可 以 返回 变量 的 值 GRISE 20), 或 者 返回 1， 这 表示 该 值 是 不 确定 的 ， 此 


bbs.theithome.com 











34 第 2 章 UNIX 标准 化 及 实现 


时 并 不 改变 errno 的 值 。 
(3) _SC_CLK_TCK 的 返回 值 是 每 秒 钟 的 时 钟 滴答 数 ， 以 用 于 times 函 数 (88.1645) 的 返 
回 值 。 


32-11 pathconf 和 fpathconf 的 限制 及 name 参 数 


FILESIZEBITS 以 带 符 号 整 型 值 表示 在 指定 目录 中 人 允许 的 普通 _PC_FILESIZEBITS 
文件 最 大 长 度 所 需 的 最 少 位 数 

LINK_MAX 文件 链接 数 的 最 大 值 _PC_LINK_MAX 

MAX_CANON 终端 规范 输入 队列 的 最 大 字 节 数 、 _PC_MAX_CANON 


MAX_INPUT 终端 输入 队列 可 用 空间 的 字 节 数 _PC_MAX_INPUT 
NAME_MAX 文件 名 的 最 大 字 节 数 (不 包括 终止 字符 null) —PC. NAME MAX 
PATH MAX 相对 路 径 名 的 最 大 字 节 数 ， 包 括 终 填 字 符 null —PC_PATH_MAX 
PIPE_BUF 能 原子 地 写 到 管道 的 最 大 字 节 数 _PC_PIPE_BUF 
SYMLINK_MAX 符号 链接 中 的 字 节 数 _PC_SYMLINK_MAX 





对 于 pathconf 的 参数 pathname 以 及 fpathconf 的 参数 filedes 有 一 些 限制 。 如 果 不 满足 其 
中 任何 一 个 限制 ， 则 结果 是 未 定义 的 。 

(1) _PC_MAX_CANON 和 PC_MAX_INPUT 所 引用 的 文件 必须 是 终端 文件 。 

(2) _PC_LINK_MAX 所 引用 的 文件 可 以 是 文件 或 目录 。 如 果 是 目录 ， 则 返回 值 用 于 目录 本 
身 (而 不 是 用 于 目录 内 的 文件 名 项 )。 

(3) _PC_FILESIZEBITS 和 .PC_NAME_MAX 所 引用 的 文件 必须 是 目录 ， 返 回 值 用 于 该 目 
录 中 的 文件 名 。 

(4) _PC_PATH_MRAX 引 用 的 文件 必须 是 目录 。 当 所 指定 的 目录 是 工作 目录 时 ， 返 回 值 是 相 
对 路 径 名 的 最 大 长 度 (不 幸 的 是 ， 这 不 是 我 们 想 要 知道 的 一 个 绝对 路 径 名 的 实际 最 大 长 度 ， 我 
们 将 在 2.5.5 节 中 再 回 到 这 一 问题 上 来 )。 

(5) _PC_PIPE_BUF 所 引用 的 文件 必须 是 管道 、FIFO 或 目录 。 在 管道 或 FIFO 情 况 下 ， 返 回 
值 是 对 所 引用 的 管道 或 FIFO 的 限制 值 。 对 于 目录 ， 返 回 值 是 对 在 该 目录 中 创建 的 任 一 FIFO 的 
限制 值 。 

(6) _PC_SYMLINK_MAX 所 引用 的 文件 必须 是 目录 。 返 回 值 是 该 目录 中 符号 链接 可 能 包含 

的 字符 串 的 最 大 长 度 。 





程序 清单 2-1 中 所 示 的 awk(1) 程 序 构建 了 一 个 C 程 序 ， 它 打印 各 pathconf 和 sysconf 符 号 
的 值 。 
程序 清单 2-1 构建 C 程 序 以 打印 所 有 得 到 支持 的 系统 配置 限制 
BEGIN { 
printf ("#include \"apue.h\"\n") 


printf ("#include <errno.h>\n") 
printf ("#include <limits.h>\n") 
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printf ("An") 
printf ("static void pr sysconf(char *, int); Mn") 
printf("static void pr pathconf(char *, char *, int);\n") 
printf ("Mn") 
printf ("int\n") 
printf ("main(int argc, char *argv[])\n") 
printf ("{\n") 
printf ("\tif (argc != 2)\n") 
printf ("\t\terr_ quit (\"usage: a.out <dirname>\") ;\n\n") 
FS="\t+" 
while (getline «"sysconf.sym" > 0) { 
printf ("#ifdef ¢s\n", $1) 
printf ("\tprintf(\"%s defined to be $%d\\n\", %$8+0);\n", $1, $1) 
printf ("#else\n") 
printf ("\tprintf(\"no symbol for %s\\n\");\n", $1) 
printf ("#endif\n") 
printf ("#ifdef ts\n", $2) 
printf ("\tpr_sysconf (\"%s =\", %s);\n", $1, $2) 
printf ("#else\n") 
printf ("\tprint£(\"no symbol for %s\\n\");\n", $2) 
printf ("#endif\n") 
} 
close ("sysconf.sym") 
while (getline <"pathconf.sym" > 0) { 
printf ("#ifdef $sWn", $1) 
printf ("\tprintf(\"%s defined to be %$d\\n\", %s+0);\n", $1, $1) 
printf ("#else\n") 
printf ("\tprintf£(\"no symbol for %s\\n\");\n", $1) 
printf ("#endif\n") 
printf ("#ifdef %s\n", $2) 
printf ("\tpr_pathconf (\"%s =\", argv[1], %s);\n", $1, $2) 
printf ("#else\n") 
printf ("\tprintf(\"no symbol for ¢s\\n\");\n", $2) 
printf ("#endif\n") 
} 
close ("pathconf.sym") 
exit 


{ 

printf ("\texit (0) ;\n") 

printf ("}\n\n") 

printf ("static void\n") 

printf ("pr_sysconf (char *mesg, int name) Mn") 
printé("{\n") 

printf("\tlong val;\n\n") 

printf ("\tfputs(mesg, stdout) ;\n") 

printf ("\terrno = 0;\n") 

printf ("\tif ((val = sysconf(name)) < 0) {\n") 
printf ("\t\tif (errno != 0) {\n") 

printf ("\t\t\tif£ (errno == EINVAL) \n") 

printf ("\t\t\t\tfputs(\" (not supported) \\n\", stdout) ;\n") 
printf ("\t\t\telse\n") 

printf ("\t\t\t\terr_sys(\"sysconf error\");\n") 
printf ("\t\t} eise {\n") 

printf ("\t\t\tfputs(\" (no limit)\\n\", stdout) ;\n") 
printf ("\t\t}\n") 

printf ("\t} else {\n") 

printf ("\t\tprinté(\" $$1ld\\n\", val) ;\n") 
printf ("\t}\n') 

printf ("}\n\n") 
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printf ("static void\n") 

printf ("pr_pathconf (char *mesg, char *path, int name) \n") 
printf ("{\n") 

print£("\tlong val;\n") 

printf ("An") 

printf ("\tfputs (mesg, stdout) ;\n") 

printf ("\terrno = 0;\n") 

printf ("\tif ((val = pathconf (path, name)) < 0) {\n") 
printf("\t\tif (errno != 0) {\n") 

printf ("\t\t\tif (errno == EINVAL) \n") 

printf ("\t\t\t\tfputs(\" (not supported) \\n\", stdout) ; Mn") 
printf ("\t\t\telse\n") 

printf ("\t\t\t\terr_sys(\"pathconf error, path = %%s\", path) ;\n") 
printf("\t\t} else {\n") 

printf ("\t\t\tfputs(\" (no limit) \\n\", stdout) ;\n") 

printf ("\t\t}\n") 

printf("\t} else {\n") 

printf ("\t\tprintf (\" $$1ld\\n\", val) ;\n") 

printf ("\t}\n") 

printf ("}\n") 


} 


该 awk 程 序 读 取 两 个 输入 文件 一 一 pathconf .sym 和 sysconfig .sym， 这 两 个 文件 中 包 
含 了 用 制 表 符 分 隔 的 限制 名 和 符号 列表 。 并 非 每 种 平台 都 会 定义 所 有 符号 ， 所 以 围绕 每 个 
pathconf 和 sysconf 调 用 ，awk 程 序 都 使 用 了 必要 的 #ifdef 语 句 。 

例如 ，awk 程 序 将 输入 文件 中 类 似 于 下 列 形式 的 行 


NAME_MAX .PC NAME MAX 
转换 成 下 列 C 代 码 ; 


#ifdef NAME_MAX 

printf ("NAME MAX is defined to be %d\n", NAME MAX«0); 
#else 

printf ("no symbol for NAME MAX\n"); 
#endif 
#ifdef PC NAME MAX 

pr pathconf("NAME MAX =", argv(1], PC NAME MAX); 
#else 

printf ("no symbol for PC NAME MAX\n"); 
#endif 


程序 清单 2-2 中 的 程序 由 awk 产生 ， 它 会 打印 所 有 这 些 限 制 ， 并 处 理 未 定义 限制 的 情况 。 
程序 清单 2-2 打印 所 有 可 能 的 sysconf 和 pathconf 值 


#include "apue.h" 
#include <errno.h> 
#include <limits.h> 


static void pr_sysconf (char *, int); 

Static void pr_pathconf (char *, char *, int); 
int 

main(int argc, char *argv[]}) 


{ 
if (arge != 2) 
err quit ("usage: a.out <dirname>") ; 
#ifdef ARG MAX 
printf("ARG MAX defined to be %d\n", ARG _MAX+0) ; 
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#else 
printf ("no symbol for ARG_MAX\n"); 
#endif 
#ifdef SC ARG MAX 
pr sysconf("ARG MAX =", SC ARG MAX); 
#else 
printf ("no symbol for SC ARG MAX\n"); 
#endif 
/* similar processing for all the rest of the sysconf symbols... */ 
#ifdef MAX CANON 
printf ("MAX CANON defined to be %d\n", MAX CANON«0); 
#else 
printf ("no symbol for MAX _CANON\n"); 
#endif 
#ifdef PC MAX CANON 
pr pathconf ("MAX CANON =", argv[1], PC MAX CANON); 
#telse 
printf ("no symbol for PC MAX CANON\n"); 
#endif 
/* similar processing for all the rest of the pathconf symbols... */ 


exit (0); 


} 


static void 
pr_sysconf (char *mesg, int name) 


long val; 


fputs (mesg, stdout); 
errno = 0; 
if ((val = sysconf(name)) < 0) { 
if (errno != 0) { 
if (errno == EINVAL) 
fputs(" (not supported) \n", stdout); 
else 
err sys("sysconf error"); 
) eise ( 
fputs(" (no limit)WMn", stdout); 


) else { 
printf(" $1dMn", val); 
} 


} 


static void 
pr_pathconf (char *mesg, char *path, int name) 


{ 


long val; 


fputs(mesg, stdout); 
errno = 0; 
if ((val = pathconf(path, name)) « 0) { 
if (errno != 0) { 
if (errno == EINVAL) 
fputs(" (not supported) \n", stdout); 
else 
err_sys("pathconf error, path = $s", path); 
} else { 
fputs(" (no limit)\n", stdout); 
} 
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} else { 


printf (" $1dWMn", val); 


} 
} 


表 2-12 总 结 了 在 本 书 讨论 的 四 种 系统 上 程序 清单 2-2 的 输出 结果 。“ 无 符号 ” 


项 表示 该 系统 


没有 提供 相应 的 _Sc 或 _PC 符 号 以 查询 相关 常量 值 。 因 此 ， 该 限制 是 未 定义 的 。 与 此 相对 照 ， 


“不 受 支持 ”项 表示 该 符号 由 系统 定义 ， 但 是 未 被 sysconf 或 pathcon 函 数 识别 。 


“无 限制 ” 


项 表示 该 系统 将 相关 常量 定义 为 无 限制 ， 但 并 不 表示 该 限制 值 可 以 是 无 限 的 。 


| omm O FreeBSD 5.2.1 Linux 2.4.22 Mac OS X 10.3 


ARG MAX 

ATEXIT MAX 
CHARCLASS. NAME MAX 
CHILD, MAX 

clock ticks/second 
COLL WEIGHTS MAX 
FILESIZEBITS 
HOST NAME MAX 
IOV MAX 

LINE MAX 

LINK MAX 
LOGIN, NAME MAX 
MAX CANON 

MAX INPUT 

NAME MAX 
NGROUPS, MAX 
OPEN MAX 
PAGESIZE 

PAGE, SIZE 
PATH, MAX 

PIPE, BUF 

RE. DUP. MAX 
STREAM, MAX 
SYMLINK MAX 
SYMLOOP_MAX 
TTY NAME MAX 
TZNAME MAX 


表 2-12 配置 限制 的 实例 


131 072 
2 147 483 647 
2 048 


| | Solaris9 | | | Solaris9 | 


1 048 320 | 1048320 | 
无 限制 无 限制 
14 14 

7 877 7 877 


不 受 支持 
无 符号 
16 

2 048 





我 们 将 在 4.14 节 中 看 到 ，UFES 是 Berkeley 快 速 文件 系统 的 SVR4 实 现 。PCES 是 Solaris 的 MS- 


DOS FAT 文 件 系统 实现 。 
2.5.5 不 确定 的 运行 时 限制 


回 


前 面 已 提 及 某 些 限 制 值 可 能 是 不 确定 的 。 我 们 遇 到 的 问题 是 ， 如 果 这 些 限制 值 没 有 在 头 文 
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件 <1imits.h> 中 定义 ， 那 么 在 编译 时 也 就 不 能 使 用 它们 。 但 是 ， 如 果 它 们 的 值 是 不 确定 的 ， 
那么 在 运行 时 它们 可 能 也 是 未 定义 的 ! 让 我 们 观察 两 种 特殊 的 情况 : 为 一 个 路 径 名 分 配 存 储 区 ， 
以 及 确定 文件 描述 符 的 数目 。 

1. 路 径 名 

很 多 程序 需要 为 路 径 名 分 配 存储 区 。 一 般 来 说 ， 在 编译 时 就 为 其 分 配 了 存储 区 ， 而 且 不 同 
的 程序 使 用 各 种 不 同 的 幻 数 (其 中 很 少 是 正确 的 ) 作为 数组 长 度 。 例 如 ，256、512、1024 或 标 
准 VO 常 量 BUFSIZ。4.3BSD 头 文件 <sys/param.h> 中 的 常量 MAXPATHLEN 是 正确 值 ， 但 是 很 
多 4.3BSD 应 用 程序 并 未 使 用 它 。 

POSIX.1 试 图 用 PATH_MAX 值 来 帮助 我 们 ， 但 是 如 果 此 值 是 不 确定 的 ， 那 么 仍 是 上 毫 无 帮助 
的 。 程 序 清单 -3 显示 了 一 个 全 书 中 用 来 为 路 径 名 动态 分 配 存 储 区 的 函数 。 

如 车 在 <l1imits.h> 中 定义 了 常量 PATH_MAX， 那 么 就 没有 任何 问题 ， 如 果 没 有 定义 ， 则 
需 调 用 pathconf。 因 为 pathconf 的 返回 值 是 基于 工作 目录 的 相对 路 径 名 的 最 大 长 度 ， 而 工 
作 目 录 是 其 第 一 个 参数 ， 所 以 ， 指 定 根 目 录 为 第 一 个 参数 ， 并 将 得 到 的 返回 值 加 1 作为 结果 值 。 
如 果 pathconf 指 明 PATH_MAX 是 不 确定 的 ， 那 么 我 们 就 只 能 猜测 某 个 值 。 

对 于 PAIH_MAX 是 否 在 路 径 名 末尾 包括 一 个 null 字 符 这 一 点 ，SUS v3 之 前 的 标准 表述 得 不 
清楚 。 出 于 安全 方面 的 考虑 ， 如 果 操 作 系统 实现 遵循 先前 的 标准 版 本 ， 则 需要 在 为 路 径 名 分 配 
的 存储 数量 上 加 1。 

处 理 不 确定 结果 这 种 情况 的 正确 方法 与 如 何 使 用 所 分 配 的 存储 空间 有 关 。 例 如 ， 如 果 我 们 
为 getcwd 调 用 分 配 空间 (返回 当前 工作 目录 的 绝对 路 径 名 ， 见 4.22 节 )， 并 且 分 配 的 空间 太 小 ， 
则 返回 一 个 出 错 ， 并 将 errno 设 置 为 EFRANGE。 然 后 可 调用 realloc 来 增加 分 配 的 空间 ( 见 7.8 
节 和 习题 4.16) 并 重 试 。 不 断 重复 此 操作 ， 直 到 getcwad 调 用 成 功 执行 。 


程序 清单 2-3 为 路 径 名 动态 地 分 配 空间 


#include "apue.h" 
#include «errno.h» 
#include <limits.h> 


#ifdef PATH MAX 

static int pathmax = PATH_MAX; 
#telse 

static int pathmax = 0; 

#endif 


#define SUSV3 200112L 
static long posix_version = 0; 


/* If PATH MAX is indeterminate, no guarantee this is adequate */ 
&define PATH MAX GUESS 1024 


char * 
path alloc(int *sizep) /* also return allocated size, if nonnull */ 


char *ptr; 
int size; 


if (posix version -- 0) 
poSix version = sysconf( SC VERSION); 


if (pathmax == 0) { /* first time through */ 
errno = 0; 
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if ((pathmax = pathconf("/", PC PATH MAX)) < 0) { 
if (errno == 0) 
pathmax = PATH MAX GUESS; /* it’a indeterminate */ 
else 
err Bys("pathconf error for PC PATH MAX"); 
) eise ( 
pathmax++; /* add one since it’s relative to root */ 


if (posix version « SUSV3) 
Size = pathmax + 1; 
else 
size = pathmax; 


if ((ptr = malloc(size)) == NULL) 
err_sys("malloc error for pathname") ; 


if (sizep != NULL) 
*sizep = size; 
return (ptr); 


} 


2. 最 大 打开 文件 数 

守护 进程 (daemon process， 是 指 在 后 台 运 行 且 不 与 终端 相连 接 的 一 种 进程 ， 也 常 被 称 为 
精灵 进程 或 后 台 进程 ) 中 一 个 常见 的 代码 序列 是 关闭 所 有 打开 的 文件 。 某 些 程序 中 有 下 列 形 式 
的 代码 序列 ， 


#include <sys/param.h> 





for (i = 0; i « NOFILE; i++) 
close (i); 
这 段 程 序 假定 在 <sys /param.h> 头 文件 中 定义 了 常量 NOFILE。 另 外 一 些 程序 则 使 用 某 些 
<staio.h> 版 本 提供 作为 上 限 的 常量 _NFILE。 某 些 程序 则 将 其 上 限 值 硬 编码 为 20。 
我 们 希望 用 POSIX.1 的 OPEN_MAX 来 确定 此 值 以 提高 可 移植 性 ， 但 是 ， 如 果 此 值 是 不 确定 
的 ， 则 仍然 有 问题 。 如 果 我 们 编写 了 下 列 代码 ， 


#include <unistd.h> 
for (i = 0; i « sysconf( SC OPEN MAX); i++) 
close (i); 
而 且 如 果 OPEN_MAX 是 不 确定 的 ， 那 么 for 循 环 根本 不 会 执行 因为 sysconf 将 返回 -1。 在 这 种 
情况 下 ， 最 好 的 选择 就 是 关闭 所 有 描述 符 直 至 某 个 限制 值 ( 例 如 256)。 如 同上 面 的 路 径 名 实例 
一 样 ， 这 并 不 能 保证 在 所 有 情况 下 都 能 正确 工作 ， 但 这 却 是 我 们 所 能 选择 的 最 好 方法 。 程 序 清 
单 2-4 中 使 用 了 这 种 技术 。 


程序 清单 2-4 确定 文件 描述 符 数 


#include "apue.h" 
#include <errno.h> 
#include <limits.h> 


#ifdef OPEN MAX 

static long openmax = OPEN MAX; 
#else 

static long openmax = 0; 
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#endif 


/* 

* If OPEN MAX is indeterminate, we're not 
* guaranteed that this is adequate. 

af 

#define OPEN MAX GUESS 256 


long 
open_max (void) 


if (openmax == 0) { /* first time through */ 
errno - 0; 
if ((openmax = sysconf( SC OPEN MAX)) « 0) { 
if (errno == 0) 
openmax = OPEN MAX GUESS; /* it's indeterminate */ 
else 
err sys("sysconf error for . SC OPEN MAX") ; 
} 


} 


return (openmax) ; 


} 


我 们 可 以 耐心 地 调用 close， 直 至 得 到 一 个 出 错 返回 ， 但 是 从 close (EBADF) 出 错 返回 
并 不 区 分 无 效 描述 符 和 没有 打开 的 描述 符 。 如 果 试 用 此 技术 ， 而 且 描述 符 9 未 打开 ， 描 述 符 10 
却 打 开 了 ， 那 么 将 停止 在 9 上 ， 而 不 会 关闭 10。dup 函 数 〈( 见 3.12 节 ) 在 超过 了 CPEN_MAX 时 会 
返回 一 个 特定 的 出 错 值 ， 但 是 用 复制 一 个 描述 符 一 、 二 百 次 的 方法 来 确定 此 值 是 一 种 非常 极端 
的 方法 。 

某 些 实现 将 返回 LONG_MAX 作 为 限制 值 ， 但 这 与 不 限制 其 值 在 效果 上 是 相同 的 。Linux 对 
RATEXIT_MRAX 所 取 的 限制 值 就 属于 此 种 情况 〈 见 表 2-12)。 这 将 使 程序 的 运行 行为 变 得 非常 精 
糕 ， 因 此 它 并 不 是 一 个 好 方法 。 

例如 ， 我 们 可 以 使 用 内 建 在 Bourne-again shell 中 的 ul imit 命 令 ， 来 更 改进 程 可 同时 打开 的 
最 大 文件 数 。 如 果 要 将 此 限制 值 设 置 为 在 效果 上 是 无 限制 的 ， 那 么 通常 要 求 具有 特权 (超级 用 
户 )。 但是， 一 旦 将 其 值 设 置 为 无 穷 大 ，sysconf 就 会 将 LONG_MAX 报 告 为 OPEN_MAX 的 限制 
值 。 程 序 若 将 此 值 作为 要 关闭 的 文件 描述 符 数 的 上 限 (如 程序 清单 2-4 所 示 )， 那 么 为 了 试图 关 
闭 2 147 483 647 个 文件 描述 符 ， 就 会 浪费 大 量 的 时 间 ， 实 际 上 其 中 绝 大 多 数 文件 描述 符 并 未 得 
到 使 用 。 

支持 Single UNIX Specification hAIXSIP R35 Z3 GE Tgetrlimit(2) mex (007.1155), 
它 可 用 来 返回 一 个 进程 可 以 同时 打开 的 最 大 描述 符 数 。 使 用 该 函数 ， 我 们 能 够 检测 出 对 于 进程 
能 够 打开 的 文件 数 实际 上 并 没有 设置 上 限 ， 于 是 也 就 避 开 了 这 个 问题 。 


OPEN_MRAX 被 POSIX 称 为 运行 时 不 变 值 ， 这 总 味 着 在 一 个 进程 的 生存 期 内 其 值 不 应 发 生变 化 。 但 是 
在 支持 XSI 扩 展 的 系统 上 ， 可 以 调用 setrlimit(2) 函 数 〈 见 7.11 节 ) 更 改 一 个 运行 进程 的 OPEN_MAX 值 
(也 可 用 C shell 的 limit 命 令 或 Bourne shell, Bourne-again shell 和 Korn shell#julimit 4 4% ARA). 
如 果 系 统 支持 这 种 功能 ， 则 可 以 更 改 程序 清单 2-4 中 的 函数 ,使 得 每 次 调用 此 函数 时 都 会 调用 sysconf， 
而 不 只 是 发 生 在 第 一 次 调用 此 函数 时 。 
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2.6 选项 


表 2-5 中 列 出 了 POSIX.1 的 选项 ， 并 在 2.2.3 节 中 讨论 了 XSI 选 项 组 。 如 果 我 们 要 编写 一 些 可 
移植 的 应 用 程序 而 这 些 程序 与 所 有 得 到 支持 的 选项 有 关 ， 那 么 就 需要 一 种 可 移植 的 方法 以 决定 
一 种 实现 是 否 支 持 一 个 给 定 的 选项 。 

如 同 对 限制 的 处 理 (12.535) 一 样 ，Single UNIX Specification 定 义 了 三 种 处 理 方法 : 

(1) 编译 时 选项 定义 在 <unistd.h> 中 。 

(2) 与 文件 或 目录 无 关 的 选项 用 sysconf 消 数 确定 。 

(3) 与 文件 或 目录 有 关 的 选项 通过 调用 pathconf 或 fpathconf 函 数 来 发 现 。 

选项 包括 列 在 表 2-5 的 第 3 列 中 的 符号 ， 以 及 列 在 表 2-13 和 表 2-14 中 的 符号 。 如 车 符号 常量 
未 定义 ， 则 必须 使 用 sysconf、pathconf 或 fpathconf 以 决定 该 选项 是 否 受 到 支持 。 在 这 
种 情况 下 ， 这 些 函 数 的 name 参 数 前 级 _POSIX 必 须 替换 为 _Sc 或 _PC。 对 于 以 _XOPEN 为 前 缀 的 
常量 ， 则 在 构成 Lame 参 数 时 必须 在 其 前 放置 _sc 或 _PC 字 符 串 。 例 如 ， 若 常量 _POSIX_ 
THREADS 是 未 定义 的 ， 那 么 就 可 以 将 name 参 数 设 置 为 _SC_THREADS， 并 以 此 调用 sysconf 以 
确定 该 平台 是 否 支持 POSIX 线 程 选项 。 如 若 常 量 _XOPEN_UNIX 是 未 定义 的 ， 那 么 就 可 以 通过 
将 name 参 数 设置 为 _SC_XOPEN_UNIX， 来 调用 sysconf 以 确定 该 平台 是 否 支持 XSI 扩 展 。 

如 果 该 平台 定义 了 符号 常量 ， 则 有 以 下 三 种 可 能 : 

(1) 如 果 符 号 常量 的 定义 值 为 -1， 那 么 该 平台 不 支持 相应 的 选项 。 

(2) 如 果 符 号 常量 的 定义 值 大 于 0， 那 么 该 平台 支持 相应 的 选项 。 

(3) 如 果 符 号 常量 的 定义 值 为 0， 则 必须 调用 sysconf、pathconf 或 fpathconf 以 确定 
相应 的 选项 是 否 受 到 支持 。 

除 表 2-5 中 已 列 出 的 那些 选项 之 外 ， 表 2-13 还 总 结 了 另外 一 些 选项 以 及 它们 的 符号 常量 ， 
sysconf 可 以 使 用 这 些 符号 常量 。 


2-13 ”sysconf 的 选项 及 name 参 数 


_POSIX_JOB_CONTROL 指明 此 实现 是 否 支持 作业 控制 _SC_JOB_CONTROL 

_POSIX_READER_WRITER_LOCKS 指明 此 实现 是 否 支持 读者 - 写 者 锁 | SC READER WRITER LOCKS 

_POSIX_SAVED_IDS 指明 此 实现 是 否 支 持 saved set- _SC_SAVED_IDS 
user-ID 和 saved set-group-ID 

_POSIX_SHELL 指明 此 实现 是 否 支持 POSIX shell || SC. SHELL 

_POSIX_VERSION 指明 POSIX.1 版 本 _SC_VERSION 

_XOPEN_CRYPT 指明 此 实现 是 否 支 持 XSI 加 密 _SC_XOPEN_CRYPT 


选项 组 
_XOPEN_LEGACY 指明 此 实现 是 否 支持 XSI 遗 留 _SC_XOPEN_LEGACY 
选项 组 
_XOPEN_REALTIME 指明 此 实现 是 否 支持 XSI 实 时 _SC_XOPEN_REALTIME 
选项 组 
_XOPEN_REALTIME_THREADS 指明 此 实现 是 否 支持 XSI 实 时 ..SC, XOPEN, REALTIME, THREADS 
线程 选项 组 
_XOPEN_VERSION 指明 XSI 版 本 ..SC, XOPEN. VERSION 





表 2-14 中 总 结 了 pathconf 和 fpathconf 使 用 的 符号 常量 。 如 同系 统 限制 一 样 ， 关 于 


bbs.theithome.com 





2.6 i 项 43 


sysconf、bathconf 和 fpathconf 如 何 处 理 选项 ， 有 如 下 几 点 值得 注意 : 

(1) _SC_VERSION 的 返回 值 表示 与 该 标准 相关 的 年 (以 4 位 数 表示 ) 和 月 (以 2 位 数 表 示 )。 
该 值 可 能 是 198808L、199009L、199506L， 或 者 表示 读 标 准 后续 版 本 的 其 他 值 ， 与 SUS v3 相关 
的 值 是 200112L。 

(2) _SC_XOPEN_VERSION 的 返回 值 表示 该 系统 遵循 的 XS] 版 本 。 与 SUS v3 相关 联 的 值 是 600。 

(3) _SC_JOB_CONTROL、SC_SAVED_IDS 以 及 _PC_VDISABLE 的 值 不 再 表示 可 选 功能 。 
ASUS v3 起 ， 不 再 需要 这 些 功能 ， 但 这 些 符号 仍然 被 保留 ， 以 便 向 后 兼容 。 

(4) 如 果 所 指定 的 pathname 或 filedes 不 支持 此 功能 ， 那 么 _PC_CHOWN_RESTRICTED 和 
_PC_NO_TRUNC 返 回 一 1， 而 不 会 改变 errno。 

(5) _PC_CHOWN_RESTRICTED 引 用 的 文件 必须 是 文件 或 者 目录 。 如 果 是 目录 ， 那 么 返回 
值 指明 该 选项 是 否 可 应 用 于 该 目录 中 的 各 个 文件 。 

(6) _PC_NO_TRUNC 引 用 的 文件 必须 是 一 个 目录 。 其 返回 值 可 用 于 该 目录 中 的 各 文件 名 。 

(7) _PC_VDISABLE 引 用 的 文件 必须 是 一 个 终端 文件 。 


表 2-14 pathconf 和 fpathconf 的 选项 及 name 参 数 


_POSIX_CHOWN_RESTRICTED. | 指明 使 用 chown 是 否 是 受 限 的 _PC_CHOWN_RESTRICTED 
..POSIX, NO, TRUNC 指明 路 径 名 长 于 NAME_MAX 是 否 会 出 错 _PC_NO_TRUNC 


_POSIX_VDISABLE 车 定义 ， 可 以 用 此 值 禁 用 终端 特殊 字符 _PC_VDISABLE 
_POSIX_ASYNC_IO 指明 对 相关 联 的 文件 是 否 可 以 使 用 异步 IO _PC_ASYNC_IO 
_POSIX_PRIO_IO 指明 对 相关 联 的 文件 是 否 可 以 使 用 优先 的 IO | | PC. PRIO IO 
—POSIX_SYNC_IO 指明 对 相关 联 的 文件 是 否 可 以 使 用 同步 JO .PC. SYNC, IO 


表 2-15 中 列 出 了 若干 配置 选项 以 及 它们 在 本 书 所 讨论 的 四 个 示例 系统 上 的 对 应 值 。 应 该 注 
意 的 是 ， 有 几 个 系统 还 没有 跟 上 Single UNIX Specification 的 最 新 版 本 。 例 如 ，MAC OS X 10.3 
支持 POSIX 线 程 ， 但 将 _POSIX_THREADS 定 义 为 

#define _POSIX_THREADS 


它 没有 指定 一 个 值 。 为 了 遵循 SUS v3 ， 如 若 定义 了 该 符号 ， 那 么 其 值 应 该 设置 为 0、-1 或 
200112。 





表 2-15 配置 选项 的 实例 


5.2.1 2.4.22 10.3 UFS 文 件 系统 | PCFS 文 件 系统 | 


_POSIX_CHOWN_RESTRICTED 
.POSIX JOB CONTROL 
.POSIX NO TRUNC 


.POSIX SAVED IDS 

POSIX, THREADS 200112 

..POSIX VDISABLE 255 

POSIX, VERSION 200112 198808 
—XOPEN UNIX 不 被 支持 未 定义 
_XOPEN_VERSION 不 被 支持 未 定义 
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如 果 未 定义 一 个 功能 ， 也 就 是 该 系统 未 定义 符号 常量 或 对 应 的 _SC 或 _ PC 名 字 ， 则 将 相关 
记录 项 标记 为 “未 定义 ”。 与 此 相对 照 ,，“ 已 定义 ”记录 项 表示 该 符号 常量 已 定义 ,但 未 指定 值 ， 
前 面 的 _POSIX_THREADS 例 子 显示 了 这 一 点 。 如 若 系 统 定义 了 符号 常量 ， 但 其 值 为 -1 或 为 0， 
但 相应 的 sysconf 或 pathconf 调 用 返回 -1， 那 么 该 记录 项 将 被 标记 为 “不 被 支持 ”。 

注意 ， 当 用 于 Solaris PCFS 文 件 系统 中 的 文件 时 ， 对 于 _PC_NO_TRUNC， pathconfjh [Bl 
值 ~1。PCFS 系 统 支持 DOS 软 盘 格 式 ，DOS 文 件 名 按 DOS 文 件 系 统 所 要 求 的 8.3 格 式 截断 ， 在 进 
行 此 种 操作 时 并 无 任何 提示 。 


2.7 功能 测试 宏 


如 前 所 述 ， 在 头 文件 中 定义 了 很 多 POSIX.1 和 XSI 的 符号 。 但 是 除了 POSIX.1 和 XSI 的 定义 
之 外 ， 大 多 数 实现 在 这 些 头 文件 中 也 加 上 了 它们 自己 的 定义 。 如 果 在 编译 一 个 程序 时 ， 希 望 它 
只 使 用 POSIX 的 定义 而 不 使 用 任何 实现 定义 的 限制 ， 那 么 就 需 定义 常量 _POSIX_C_SOURCE。 
所 有 POSIX.1 头 文件 中 都 使 用 此 常量 。 当 定义 该 常量 时 ， 就 能 排除 任何 实现 专 有 的 定义 。 


POSIX.1 标 准 的 以 前 版 本 都 定义 了 _POSIX_SOURCE 常 量 。 在 POSIX.1 的 2001 版 中 ， 它 被 替换 为 
.POSIX C SOURCE, 


常量 _POSTX_C_SOURCE 及 _XOPEN_SOURCE 被 称 为 功能 测试 宏 (feature test macro), ff 
有 功能 测试 宏 都 以 下 划 线 开始 。 当 要 使 用 它们 时 ， 通常 在 cc 命令 行 中 以 下 列 方式 定义 : 
cc -D_POSIX_C_SOURCE=200112 file.c 


这 使 得 在 C 程 序 包 括 任何 头 文件 之 前 ， 定 义 了 功能 测试 宏 。 如 果 我 们 仅 想 使 用 POSIX.1 定 义 ， 那 
么 也 可 将 源 文件 的 第 一 行 设置 为 : 
#define POSIX C SOURCE 200112 


为 使 Single UNIX Specification v3 的 功能 可 由 应 用 程序 使 用 ， 需 将 常量 _XOPEN_SOURCE 定 
义 为 600。 这 与 涉及 POSIX.1 功 能 时 将 _POSIX_C_SOURCE 定 义 为 200112L 的 作用 相同 。 

Single UNIX Specification 将 c99 实 用 程序 定义 为 C 编 译 环境 的 接口 。 随 之 ， 就 可 以 用 如 下 方 
式 编译 文件 : 

c99 -D XOPEN SOURCE=600 file.c -o file 


为 了 在 gcc C 编 译 器 中 启用 1999 ISO C 扩 展 ， 可 以 使 用 -sta = c99 选 项 ， 如 下 所 示 : 


gcc -D_XOPEN_SOURCE=600 -std=c99 file.c -o file 


另 一 个 功能 测试 宏 是 ， _ _STDC__， 它 由 符合 ISO C 标 准 的 C 编 译 器 自动 定义 。 这 样 就 允许 我 
们 编写 ISO C 编 译 器 和 非 ISO C 编 译 器 都 能 编译 的 程序 。 例 如 ， 为 了 利用 ISO C 原 型 功能 (如 果 
支持 ) ， 一 个 头 文件 可 能 包含 : 

#ifdef STDC — 

void *myfunc (const char *, int); 

#else 


void *myfunc(); 
#endif 


虽然 ， 当 今 的 大 多 数 C 编 译 器 都 支持 SO C 标 准 ， 但 在 很 多 头 文件 中 仍旧 使 用 __sTrDpc_ 功能 
测试 宏 。 
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2.8 基本 系统 数据 类 型 


历史 上 ， 某 些 UNIX 系 统 变量 已 与 某 些 C 数 据 类 型 联系 在 一 起 。 例 如 ， 历 史上 主 、 次 设备 号 
一 直 存放 在 一 个 16 位 的 短 整 型 中 ，8 位 表示 主 设备 号 ， 另 外 8 位 表示 次 设备 号 。 但 是 ， 很 多 较 大 
的 系统 需要 用 多 于 256 个 值 来 表示 其 设备 号 ， 于 是 ， 就 需要 有 一 种 不 同 的 技术 (实际 上 ，Solaris 
用 32 位 表示 设备 号 ，14 位 用 于 主 设备 号 ，18 位 用 于 次 设备 号 )。 

头 文件 <sys/types .h> 中 定义 了 某 些 与 实现 有 关 的 数据 类 型 ， 它 们 被 称 为 基本 系统 数据 
类 型 (primitive system data type)。 还 有 很 多 这 种 数据 类 型 定义 在 其 他 头 文件 中 。 在 头 文件 中 ， 
这 些 数 据 类 型 都 是 用 C 的 typedef 功 能 来 定义 的 。 它 们 绝 大 多 数 都 以 t 结 尾 。 表 2-16 中 列 出 了 
本 书 将 使 用 的 很 多 基本 系统 数据 类 型 。 


表 2-16 某 些 常用 的 基本 系统 数据 类 型 


caddr_t 核心 地 址 (14.9 节 ) 

clock t 时 钟 滴答 计数 器 (进程 时 间 ) (1.1015) 
comp_t 压缩 的 时 钟 滴答 (8.1445) 

dev_t 设备 号 ( 主 和 次 ) (42338) 

fd set 文件 描述 符 集 (14.5.1 节 ) 

fpos t 文件 位 置 (5.10 节 ) 

gid t 数值 组 ID 

ino_t i 节点 编号 (4.1445) 

mode_t 文件 类 型 ， 文 件 创建 模式 (4.5 节 ) 

nlink_t 目录 项 的 链接 计数 (4.14 节 ) 

off_t 文件 大 小 和 偏 移 量 ( 带 符 号 的 ) (1seek, 3.615) 
pid_t 进程 ID 和 进程 组 ID ( 带 符号 的 ) (8.2 节 和 9.4 节 ) 
ptrdiff_t 两 个 指针 相 减 的 结果 ( 带 符 号 的 ) 

rlim t 资源 限制 (7.1145) 

sig_atomic_t 能 原子 地 访问 的 数据 类 型 (10.154) 
sigset_t {43H (10.1145) 

size_t HR 〈 例 如 字符 串 ) 大 小 (不 带 符号 的 ) (3.745) 
ssize_t 返回 字 节 计数 的 函数 〈 带 符号 的 ) (read, write, 3.74) 
time_t 日 历时 间 的 秒 计数 器 (1.105) 

uid.t 数值 用 户 ID 

wchar, t 能 表示 所 有 不 同 的 字符 码 


用 这 种 方式 定义 了 这 些 数据 类 型 后 ， 就 不 再 需要 考虑 因 系 统 而 异 的 程序 实现 细节 。 在 本 书 
中 涉及 这 些 数据 类 型 时 ， 我 们 会 说 明 为 什么 要 使 用 它们 。 


2.9 标准 之 间 的 冲突 


就 整体 而 言 ， 这 些 不 同 的 标准 之 间 配 合 得 相当 好 。 但 是 我 们 也 很 关注 它们 之 闻 的 差别 ， 特 
别 是 ISO C 标 准 和 POSIX.1 之 间 的 差别 ， 而 它们 之 间 也 确实 有 一 些 差别 (因为 SUS v3 是 POSIX.1 
的 超 集 ， 所 以 不 对 它 进行 特别 的 说 明 ) 。 
ISO C 定 义 了 函数 clock， 它 返回 进程 使 用 的 CPU 时 间 ， 返 回 值 类 型 是 clock_t。 为 了 将 
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此 值 变换 成 以 秒 为 单位 ， 将 其 除 以 在 <time .h> 头 文件 中 定义 的 CLOCKS_PER_SEC。POSIX.! 
定义 了 函数 times， 它 返回 其 调用 者 及 其 所 有 终止 子 进程 的 CPU 时 间 以 及 时 钟 时 间 ， 所 有 这 些 
值 都 是 clock_t 类 型 值 。sysconf 函 数 用 来 获取 每 秒 钟 的 滴答 数 ， 用 于 表示 times 函 数 的 返 
回 值 。 有 一 个 相同 的 术语 ， 即 每 秒 钟 的 滴答 数 ， 但 ISO C 和 POSIX.1 的 定义 却 不 同 。 这 两 个 标准 
也 用 同一 数据 类 型 (clock t) 来 保存 这 些 不 同 的 值 ， 这 种 差别 可 以 在 Solaris 中 看 到 ， 其 中 
clock 返 回 微 秒 数 (因此 ，CLOCK_PER_SEC 是 一 百 万 ) 而 sysconf 为 每 秒 钟 的 滴答 数 返 回 
的 值 是 100。 

另 一 个 可 能 产生 冲突 的 领域 是 ， 在 ISO C 标 准 定义 函数 时 ， 可 能 没有 考虑 到 POSIX.1 的 某 些 
要 求 。 在 POSIX 环 境 下 ， 有 些 函 数 可 能 要 求 有 一 个 与 C 环 境 下 不 同 的 实现 ， 因 为 POSIX 环 境 中 
有 多 个 进程 ， 而 ISO C 环 境 则 很 少 考虑 主机 操作 系统 。 尽 管 如 此 ， 很 多 依从 POSIX 的 系统 为 了 
兼容 性 也 会 实现 ISO C 函 数 。signal 函 数 就 是 一 个 例子 。 如 果 在 不 了 解 的 情况 下 使 用 了 Solaris 
所 提供 的 signal 函 数 (希望 编写 可 在 ISO C 环 境 和 较 早 的 UNIX 系 统 中 运行 的 可 移植 代码 ) ， 那 
么 它 将 提供 与 POSIX.1 sigaction 函 数 不 同 的 语义 。 第 10 章 将 对 signal 函 数 作 更 多 说 明 。 


2.10 小 结 


在 过 去 20 年 中 ， 在 UNIX 编 程 环 境 的 标准 化 方面 已 经 取得 了 很 大 进展 。 本 章 对 ISO C, 
POSIX 和 Single UNIX Specification 三 个 主要 标准 进行 了 说 明 ， 也 分 析 了 这 些 标准 对 本 书 主要 关 
注 的 四 个 实现 即 FreeBSD、Linux、Mac OS X 和 Solaris 所 产生 的 影响 。 这 些 标 准 都 试图 定义 一 些 
可 能 随 实现 而 更 改 的 参数 ， 但 是 我 们 已 经 看 到 这 些 限制 并 不 完善 。 本 书 将 涉及 很 多 这 些 限 制 和 
幻 常 量 。 

在 本 书 最 后 的 参考 书目 中 ， 说 明了 如 何 获 得 这 些 标准 的 副本 的 方法 。 
习题 
2.1 在 2.8 节 中 提 到 ， 一 些 基本 系统 数据 类 型 可 以 在 多 个 头 文件 中 定义 。 例 如 ， 在 FreeBSD 5.2.1 

中 ，size_t 在 26 个 不 同 的 头 文件 中 都 有 定义 。 由 于 一 个 程序 可 能 包含 这 26 个 不 同 的 头 文 

件 ， 并 且 ISO C 不 允许 对 同一 个 名 字 进 行 多 次 类 型 定义 ， 因 此 该 如 何 编 写 这 些 头 文件 ? 

2.2 检查 系统 的 头 文件 ， 列 出 实现 基本 系统 数据 类 型 所 用 到 的 实际 数据 类 型 。 


2.3 改写 程序 清单 2-4 中 的 程序 ， 使 其 在 sysconf 为 OPEN_MAX 限 制 返回 LONG_MAX 时 ， 避 免 进 
行 不 必要 的 处 理 。 
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3.1 引言 


本 章 开 始 计 论 UNIX 系 统 ， 先 说 明 可 用 的 文件 /0 函数 一 一 打开 文件 、 读 文件 、 写 文件 等 。 
UNIX 系 统 中 的 大 多 数 文件 LO 只 需 用 到 5 个 函数 : open, read, write、lseek 以 及 close。 
然后 说 明 不 同 缓冲 区 长 度 对 *ead 和 write 函数 的 影响 。 

本 章 所 说 明 的 函数 经 常 被 称 为 不 带 缓冲 的 IO (unbuffered MO， 与 将 在 第 5 章 中 说 明 的 标准 
LO 例 程 相 对 照 )。 术 语 不 带 组 症 指 的 是 每 个 read 和 write 都 调用 内 核 中 的 一 个 系统 调用 。 这 些 
不 带 缓冲 的 VO 函数 不 是 ISO C 的 组 成 部 分 ， 但 是 ， 它 们 是 POSIX.1 和 Single UNIX Specification 
的 组 成 部 分 。 

只 要 涉及 在 多 个 进程 间 共 享 资 源 ， 原 子 操作 的 概念 就 变 得 非常 重要 。 我 们 将 通过 文件 VO 和 
open 函 数 的 参数 来 讨论 此 概念 。 然 后 ， 本 章 将 进一步 讨论 在 多 个 进程 间 如 何 共享 文件 ， 以 及 
所 涉及 的 内 核 数 据 结构 。 在 讨论 了 这 些 特征 后 ， 将 说 明 aup、fcnt1、sync、fsync 和 ioct1 
函数 。 


3.2 文件 描述 符 


对 于 内 核 而 言 ， 所 有 打开 的 文件 都 通过 文件 描述 符 引 用 。 文 件 描述 符 是 一 个 非 负 整 数 。 当 
打开 一 个 现 有 文件 或 创建 -一 个 新 文件 时 ， 内 核 向 进程 返回 一 个 文件 描述 符 。 当 读 或 写 一 个 文件 
时 ， 人 s pedcs D E rend te, 

按照 惯例 ，UNIX EHE EE HJ REESE 
准 输出 相关 联 ， eee eee 这 是 各 种 shell) RR Bi 用 程序 使 用 的 
惯例 ， 而 与 UNIX 内 核 无 关 。 尽 管 如 此 ， 如 果 不 遵 照 这 种 惯例 ， 那 么 很 多 UNIX 系 统 应 用 程序 就 
不 能 正常 工作 。 

在 依从 POSIX 的 应 用 程序 中 ， 幻 数 0、1、2 应 当 替 换 成 符号 常量 STDIN_FILENO、 
STDOUT_FILENO 和 STDERR_FILENO。 这 些 常量 都 定义 在 头 文件 <unista.h> 

文件 描述 符 的 变化 范围 是 0 一 OPEN_MAX ( 见 表 2-10)。 早 期 的 UNIX 系 统 实现 采用 的 上 限 值 
是 19 (人 允许 每 个 进程 最 多 打开 20 个 文件 )， 但 现在 很 多 系统 则 将 其 增 至 63。 

对 于 FreeBSD 5.2.1, Mac OS X 10.3 以 及 Solaris 9,， 文件 描述 符 的 变化 范围 实际 上 是 无 限 的 ， 它 只 


受到 系统 配置 的 存储 器 总 量 、 整 型 的 字 长 以 及 系统 管理 员 所 配置 的 软 限 制 和 硬 限制 的 约束 。Linux 
2.4.22 对 于 每 个 进程 的 文件 描述 符 数 的 硬 限 制 是 1 048 576, 
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3.3 openpy Zi 
V4 Aopen Re A AFT Fr EE, 


#include «fcntl.h» 


int open(const char *pathname, int oflag, ... /* mode_t mode */ ); 


返回 值 : 若 成 功 则 返回 文件 描述 符 ， 若 出 错 则 返回 --1 





我 们 将 第 三 个 参数 写 为 .…，ISO C 用 这 种 方法 表明 余下 参数 的 数量 及 其 类 型 根据 具体 的 调用 
会 有 所 不 同 。 对 于 open 函 数 而 言 ， 仅 当 创建 新 文件 时 才 使 用 第 三 个 参数 ( 稍 后 将 对 此 进行 说 
明 )。 在 函数 原型 中 将 此 参数 放置 在 注释 中 。 

Pathname 是 要 打开 或 创建 文件 的 名 字 。oflag 参 数 可 用 来 说 明 此 函数 的 多 个 选项 。 用 下 列 一 
个 或 多 个 常量 进行 “或 ”运算 构成 ofag 参 数 (这 些 常量 定义 在 <fcnt1 .h> 头 文件 中 )， 


O_RDONLY 只 读 打 开 。 
O WRONLY 只 写 打 开 。 
O_RDWR 读 、 写 打开 。 


大 多 数 实现 将 O_RDONLY 定 义 为 0，O_WRONLY 定 义 为 1，O_RDWR 定 义 为 2， 以 与 早期 的 程序 兼容 。 


在 这 三 个 常量 中 必须 指定 一 个 且 只 能 指定 一 个 。 下 列 常量 则 是 可 选择 的 ; 

O_APPEND 每 次 写 时 都 追加 到 文件 的 尾 端 。3.11 节 将 详细 说 明 此 选项 。 

O_CREAT 车 此 文件 不 存在 ， 则 创建 它 。 使 用 此 选项 时 ， 需 要 第 三 个 参数 mode， 用 
其 指定 该 新 文件 的 访问 权限 位 (4.5 节 将 说 明文 件 的 访问 权限 位 ， 那 时 就 


能 了 解 如 何 指定 mode， 以 及 如 何 用 进程 的 umask 值 修改 它 )。 
如 果 同 时 指定 了 0_CREAT， 而 文件 已 经 存在 ， 则 会 出 错 。 用 此 可 以 测试 
一 个 文件 是 否 存在 ， 如 果 不 存在 ， 则 创建 此 文件 ， 这 使 测试 和 创建 两 者 
a i 3.11 节 将 更 详细 地 说 明 原 子 操作 。 
O_TRUN Ti ap 任 ， 和 而 且 为 只 写 或 读 写 成 功 打 开 ， 则 将 其 长 度 截 短 为 0。 
O_NOCTTY ux UT 终端 设备 ， 则 不 将 该 设备 分 配 作为 此 进程 的 控制 终 
端 。9.6 节 将 说 明 控 制 终端 。 
O_NONBLOCK 如果 pathname 指 的 是 一 个 FIFO、 一 个 块 特殊 文件 或 一 个 字符 特殊 文件 ， 
则 此 选项 为 文件 的 本 次 打开 操作 和 后 续 的 W/O 操作 设置 非 阻塞 模式 。14.2 
节 将 说 明 此 工作 模式 。 
较 早 的 系统 V 版 本 引入 了 O_NDELAY (RR) 标志 ， 它 与 O_ NONBLOCK (AME) BRAM, de 
它 的 读 操作 返回 值 具有 二 义 性 。 如 果 不 能 从 管道 、FIFO 或 设备 读 取 数据 ， 则 不 延迟 选项 使 read 返 回 0， 
这 与 表示 已 读 到 文件 尾 庙 的 返回 值 0 相 冲 突 。 基于 SVR4 的 系统 仍 支持 这 种 语义 的 不 延迟 选项 ， 但 是 新 
的 应 用 程序 应 当 使 用 不 阻塞 选项 代替 之 。 





下 面 三 个 标志 也 是 可 选 的 。 它 们 是 Single UNIX Specification (以 及 POSIX.1) 中 同步 输入 
和 输出 选项 的 一 部 分 。 
O_DSYNC 使 每 次 write 等 待 物理 1/O 操 作 完成 ， 但 是 如 果 写 操作 并 不 影响 读 取 刚 写 入 
的 数据 ， 则 不 等 待 文件 属性 被 更 新 。 
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O_RSYNC 使 每 一 个 以 文件 描述 符 作为 参数 的 read 操作 等 待 ， 直 至 任何 对 文件 同一 部 
分 进行 的 未 决 写 操作 都 完成 。 

O_SYNC 使 每 次 wzite 都 等 到 物理 IO 操作 完成 ， 包 括 由 write 操作 引起 的 文件 属性 
更 新 所 需 的 VO。3.14 节 将 使 用 此 选项 。 


O_DSYNC 和 O_SYNC 标 志 有 微妙 的 区 别 。 仅 当 文 件 属性 需要 更 新 以 反映 文件 数据 变化 (例如 ,更 新 
文件 大 小 以 反映 文件 中 包含 了 更 多 的 数据 ) 时 ，O_DSYNC 标 志 才 影响 文件 属性 。 而 设置 0_SYNC 标 志 后 ， 
数据 和 属性 总 是 同步 更 新 。 当 文件 用 O_DSYN 标 志 打 开 ， 在 重 写 其 现 有 的 部 分 内 容 时 ,文件 时 间 属 性 不 
会 同步 更 新 。 与 此 相反 ， 如 果 文 件 是 用 O_SYNC 标 志 打 开 ， 那么 对 该 文件 的 每 一 次 write 操 作 都 将 在 
write 返回 前 更 新 文件 时 间 ， 这 与 是 否 改写 现 有 字 节 或 增 写 文件 无 关 。 

Solaris 9 支持 所 有 这 三 个 标志 。FreeBSD 5.2.1 和 Mac OS X 10.3 设 置 了 另外 一 个 标志 (O FSYNC), 
它 与 标志 O_SYNC 的 作用 相同 。 因 为 这 两 个 标志 是 等 效 的 ， 所 以 FreeBSD 5.2.1 定 义 它们 为 同一 值 〈 但 夺 
怪 的 是 ，Mac OS X 10.3 没 有 定义 O_SYNC) FreeBSD 5.2.1 和 Mac OS X 10.3 不 支持 O_DSYNC 或 O_RSYNC 
标志 。Linux 2.4.22 将 它们 处 理 成 与 O_SYNC 相 同 。 


由 open 返 回 的 文件 描述 符 一 定 是 最 小 的 未 用 描述 符 数 值 。 这 一 点 被 某 些 应 用 程序 用 来 在 
标准 输入 、 标 准 输出 或 标准 出 错 输出 上 打开 新 的 文件 。 例 如 ， 一 个 应 用 程序 可 以 先 关 闭 标准 输 
出 〈 通 常 是 文件 描述 符 1) ， 然 后 打开 另 一 个 文件 ， 执 行 打 开 操作 前 就 能 了 解 到 该 文件 一 定 会 在 
文件 描述 符 1 上 打开 。 在 3.12 节 说 明 aup2 函 数 时 ， 可 以 了 解 到 有 更 好 的 方法 来 保证 在 一 个 给 定 
的 描述 符 上 打开 一 个 文件 。 

文件 名 和 路 径 名 截 短 

如 果 NAME_MAX 是 14， 而 我 们 却 试图 在 当前 目录 中 创建 一 个 其 文件 名 包含 15 个 字符 的 新 文 
件 ， 此 时 会 发 生 什么 呢 ?” 按 照 传 统 ， 早 期 的 系统 V 版 本 (例如 SVR2) 人 允许 这 种 使 用 方法 ， 但 总 
是 将 文件 名 截 短 为 14 个 字符 ,而 且 不 给 出 任何 信息 ， 而 BSD 类 的 系统 则 返回 出 错 状态 ， 并 将 
errno 设 置 为 ENAMETOOLONG。 无 声 无 息 地 截 短文 件 名 会 引起 问题 ， 而 且 它 不 仅仅 影响 到 创建 
新 文件 。 如 果 NAME_MAX 是 14， 并 且 存 在 一 个 其 文件 名 恰好 就 是 14 个 字符 的 文件 ， 那 么 以 
pathname 作 为 其 参数 的 任 一 函数 (open、stat 等 ) 都 无 法 确定 该 文件 的 原始 名 是 什么 ?其 原 
因 是 这 些 函 数 无 法 判断 该 文件 名 是 否 被 截 短 过 。 

在 POSIX.1 中 ， 常 量 _PoSIX_NO_TRUNC 决 定 了 是 要 截 短 过 长 的 文件 名 或 路 径 名 ， 还 是 返 
回 一 个 出 错 。 正 如 我 们 在 第 2 章 中 已 见 过 的 ， 根 据 文件 系统 的 类 型 ， 此 值 可 以 变化 。 


是 否 返回 一 个 出 错 值 在 很 大 程度 上 是 历史 形成 的 。 例 如 ， 基 于 SVR4 的 系统 对 传统 的 系统 V 文 件 系 
4 (SS) 并 不 产生 出 错 返回 ， 但 是 它 对 BSD 风 格 的 文件 系统 (UFS) 则 产生 出 锚 返 回 。 

作为 另 一 个 例子 ， 参 见 表 2-15。Solaris 对 UFS 返 回 出 错 ， 对 与 DOS 养 容 的 文件 系统 PCES 则 不 返 
回 出 错 ， 其 原因 是 DOS 会 无 声 无 和 急 地 截 短 不 适 配 8.3 格 式 的 文件 名 。BSD 类 系统 和 Linbux 总 是 会 返回 
ma. 


若 _POSIX_NO_TRUNC 有 效 ， 则 在 整个 路 径 名 超过 PATH_MRAX， 或 路 径 名 中 的 任 一 文件 名 
超过 NAME_MAX 时 ， 返 回 出 错 状 态 ， 并 将 errno 设 置 为 ENAMETOOLONG。 


3.4 creat 函 数 
也 可 调用 creat 函 数 创建 一 个 新 文件 。 
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#include <fcntl.h> 


int creat (const char *pathname, mode_t mode) ; 


返回 值 : 车 成 功 则 返回 为 只 写 打开 的 文件 描述 符 ， 若 出 错 则 返回 -1 





open (pathname, O WRONLY | O CREAT | O TRUNC, mode); 


在 早期 的 UNIX 系 统 版 本 中 ，ocpen 的 第 二 个 参数 只 能 是 0、1 或 2。 没 有 办 法 打开 一 个 尚未 存在 的 文 
件 ， 国 此 需要 另 一 个 系统 调用 creat 以 创建 新 文件 。 现 在 ，open 函 数 提 供 了 选项 O_CREAT 和 O_TRUNC ， 
TU SET FEE X creati, 

在 4.5 节 中 ,我 们 将 详细 说 明文 件 访问 权限 (file's access permission), ， 并 说 明 如 何 指定 mode。 

creat 的 一 个 不 足 之 处 是 它 以 只 写 方式 打开 所 创建 的 文件 。 在 提供 open 的 新 版 本 之 前 ， 
如 果 要 创建 一 个 临时 文件 ， 并 要 先 写 该 文件 ， 然 后 又 读 该 文件 ， 则 必须 先 调 用 creat、close， 
然后 再 调用 open。 现 在 则 可 用 下 列 方式 调用 open: 


open (pathname, O_RDWR | O CREAT | O TRUNC, mode) ; 


3.5 closem Zi 
可 调用 close 函 数 关 闭 一 个 打开 的 文件 : 


#include <unistd.h> 


int close(int filedes) ; 


返回 值 : 若 成 功 则 返回 9，， 若 出 错 则 返回 一 1 


关闭 一 个 文件 时 还 会 释放 该 进程 加 在 该 文件 上 的 所 有 记录 锁 。14.3 节 将 讨论 这 一 点 。 
当 一 个 进程 终止 时 ， 内 核 自动 关闭 它 所 有 打开 的 文件 。 很 多 程序 都 利用 了 这 一 功能 而 不 显 
式 地 用 close 关 闭 打开 文件 。 实 例 见 程序 清单 1-2 中 的 程序 。 


3.6 lseeki Ay 


每 个 打开 的 文件 都 有 一 个 与 其 相关 联 的 “当前 文件 偏 移 量 ”(current file offset) 。 它 通常 是 
一 个 非 负 整数 ， 用 以 度量 从 文件 开始 处 计算 的 字 节 数 (本 节 稍 后 将 对 “ 非 负 ”这 一 修饰 词 的 某 
些 例外 进行 说 明 )。 通 常 ， 读 、 写 操作 都 从 当前 文件 偏 移 量 处 开始 ， 并 使 偏 移 量 增加 所 读 写 的 
字 节 数 。 按 系统 默认 的 情况 ， 当 打开 一 个 文件 时 ， 除 非 指定 o_APPEND 选 项 ， 否 则 该 偏 移 量 被 
设置 为 0。 

可 以 调用 lseek 显 式 地 为 一 个 打开 的 文件 设置 其 偏 移 量 。 


#include <unistd.h> 





off t lseek(int filedes, oft t offset, int whence); 


返回 值 : 车 成 功 则 返回 新 的 文件 偏 移 量 ， 若 出 错 则 返回 -1 


对 参数 offset 的 解释 与 参数 whence 的 值 有 关 。 
。 若 whence 是 SEEK_SET， 则 将 该 文件 的 偏 移 量 设置 为 距 文 件 开始 处 offset 个 字 节 。 
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* 若 whence 是 SEEK_CUR， 则 将 该 文件 的 偏 移 量 设置 为 其 当前 值 加 offset，offset 可 为 正 或 负 。 
。 若 whence 是 SEEK_END， 则 将 该 文件 的 偏 移 量 设置 为 文件 长 度 加 offset:，offset 可 为 正 或 负 。 
车 1seek 成 功 执行 ， 则 返回 新 的 文件 偏 移 量 ， 为 此 可 以 用 下 列 方式 确定 打开 文件 的 当前 偏 
BE: 
OFE E currpos; 
currpos = lseek(fd, 0, SEEK CUR); 
这 种 方法 也 可 用 来 确定 所 涉及 的 文件 是 否 可 以 设置 偏 移 量 。 如 果 文 件 描述 符 引用 的 是 一 个 管道 、 
FIFEO 或 网 络 套 接 字 ， 则 1seek 返 回 -1， 并 将 erzrno 设 置 为 ESPIPE。 


三 个 符号 常量 SEEK_SET、SEEK_CUR 和 SEEK_END 是 由 系统 V 引 入 的 。 在 系统 V 之 前 ，whenice 被 指 
定 为 0 (绝对 偏 移 量 ) 1 (相对 于 当前 位 置 的 偏 移 量 ) 或 2 (相对 文件 尾 端的 偏 移 量 ) 。 现 有 的 很 多 软件 
仍然 把 这 些 数字 直接 写 在 代码 里 。 

lseek 中 的 字符 1 表示 长 整 型 。 在 引入 off_t 数 据 类 型 之 前 ，offset 参 数 和 返回 值 是 长 整 型 。lseek 
是 由 V7 引入 的 ， 当 时 C 语 言 中 增加 了 长 整 型 (在 V6 中 ， 用 函数 seek 和 tel11 提 供 类 似 功能 ) 。 


实例 
程序 清单 3-1 中 的 程序 用 于 测试 能 否 对 其 标准 输入 设置 偏 移 量 。 
程序 清单 3-1 测试 能 否 对 标准 输入 设置 偏 移 量 
#include "apue.h" 
int 
main (void) 
if (lseek(STDIN FILENO, 0, SEEK CUR) == -1) 
printf ("cannot seek\n") ; 
else 
printf ("seek OK\n") ; 


exit (0); 


} 
如 果 用 交互 方式 调用 此 程序 ， 则 可 得 : 


$ ./a.out < /etc/motd 

Seek OK 

$ cat < /etc/motd | ./a.out 

cannot seek 

$ ./a.out < /var/spool/cron/FIFO 

cannot seek 国 


通常 ， 文 件 的 当前 偏 移 量 应 当 是 一 个 非 负 整数 ， 但 是 ， 某 些 设备 也 可 能 允许 负 的 偏 移 量 。 
但 对 于 普通 文件 ， 则 其 偏 移 量 必须 是 非 负 值 。 因 为 偏 移 量 可 能 是 负 值 ， 所 以 在 比较 1seek 的 返 
回 值 时 应 当 谨 慎 ， 不 要 测试 它 是 否 小 于 0， 而 要 测试 它 是 否 等 于 一 1。 


在 Intel X86 处理 器 上 运行 的 FreeBSD 上 的 /dev/kmem 设 备 支 持 负 的 偏 移 量 。 
因为 偏 移 量 (off c) 是 带 符号 数据 类 型 ( 见 表 2-16) ， 所 以 文件 最 大 长 度 会 减少 一 半 。 例 如 ， 著 
off tX 3243498, MEX AER X KE R2"- MM T$. 


1seek 仅 将 当前 的 文件 偏 移 量 记录 在 内 核 中 ， 它 并 不 引起 任何 UO 操 作 。 然 后 ， 该 偏 移 量 用 
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于 下 一 个 读 或 写 操作 。 


文件 偏 移 量 可 以 大 于 文件 的 当前 长 度 ， 在 这 种 情况 下 ， 对 该 文件 的 下 一 次 写 将 加 长 该 文件 ， 
并 在 文件 中 构成 一 个 空洞 ， 这 一 点 是 允许 的 。 位 于 文件 中 但 没有 写 过 的 字 节 都 被 读 为 0。 

文件 中 的 空洞 并 不 要 求 在 磁盘 上 占用 存储 区 。 具 体 处 理 方式 与 文件 系统 的 实现 有 关 ， 当 定 
位 到 超出 文件 尾 端 之 后 写 时 ， 对 于 新 写 的 数据 需要 分 配 磁 盘 块 ， 但 是 对 于 原文 件 尾 端 和 新 开始 
写 位 置 之 间 的 部 分 则 不 需要 分 配 磁盘 块 。 





程序 





清单 3-2 中 的 程序 用 于 创建 一 个 具有 空洞 的 文件 。 


程序 清单 3-2 创建 一 个 具有 空洞 的 文件 


#include "apue.h" 
#include <fcnt1.h> 


char 
char 


int 


bufi[]l = "abcdefghij"; 
buf2(] = "ABCDEFGHIJ"; 


main (void) 


} 


int 


if 


fd; 


((£d = creat ("file.hole", FILE MODE)) < 0) 
err_sys("creat error"); 


if (write(fd, bufl, 10) != 10) 
err_sys("bufl write error"); 

/* offset now = 10 */ 

if (lseek(fd, 16384, SEEK_SET) == -1) 
err_sys("lseek error"); 

/* offset now = 16384 */ 

if (write(fd, buf2, 10) != 10) 
err_sys("buf2 write error"); 

/* offset now = 16394 */ 

exit (0); 


运行 该 程序 得 到 : 


$ ./a.out 


$ ls -l file.hole 检查 其 大 小 
-rw-r--r-- 1 sar 16394 Nov 25 01:01 file.hole 
$ od -c file.hole 观察 实际 内 容 


0000000 a bc de f£ gh i j\oO NO NO NO NO NO 


0000020 \0 XO NO XO NO NO XO NO NO NO XO NO NO NO NO NO 


* 


0040000 A BC DEF GHI J 
0040012 


使 用 cq(1) 命 令 观察 该 文件 的 实际 内 容 。 命 令 行 中 的 -c 标 志 表 示 以 字符 方式 打印 文件 内 容 。 
从 中 可 以 看 到 ， 文 件 中 间 的 30 个 未 写字 节 都 被 读 成 为 0。 每 一 行 开始 的 一 个 7 位 数 是 以 八进制 形 


式 表 示 的 字 节 偏 移 量 。 


为 了 证 明 在 该 文件 中 确实 有 一 个 空洞 ， 将 刚 创建 的 文件 与 具有 同样 长 度 但 无 空洞 的 文件 进 
行 比较 : 
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$ ls -ls file.hole file.nohole 比较 长 度 
8 -rw-r--r-- 1 sar 16394 Nov 25 01:01 file.hole 
20 -rw-r--r-- 1 sar 16394 Nov 25 01:03 file.nohole 


虽然 两 个 文件 的 长 度 相 同 ， 但 无 空洞 的 文件 占用 了 20 个 磁盘 块 ， 而 具有 空洞 的 文件 只 占用 8 个 
磁盘 块 。 
在 此 实例 中 调用 了 将 在 3.8 节 中 说 明 的 write 函 数 。4.12 节 将 对 具有 空洞 的 文件 进行 更 多 说 明 , 口 


因为 1seek 使 用 的 偏 移 量 是 用 off_t 类 型 表示 的 ， 所 以 允许 具体 实现 根据 各 自 特定 的 平台 
自行 选择 大 小 合适 的 数据 类 型 。 现 今 大 多 数 平台 提供 两 组 接口 以 处 理 文件 偏 移 量 : 一 组 使 用 32 
位 文件 偏 移 量 ， 另 一 组 则 使 用 64 位 文件 偏 移 量 。 

Single UNIX Specification 向 应 用 程序 提供 了 一 种 方法 ， 使 其 通过 sysconf 函 数 确 定 何 种 环 
境 受 到 支持 ( 见 2.5.4 节 )。 表 3-1 总 结 了 定义 的 sysconf 常 量 。 


表 3-1 sysconf 的 数据 大 小 选项 和 name 参 数 


_POSIX_V6_ILP32_OFF32 |int、long、pointer 和 off_t 类 型 是 32 位 _SC_V6_ILP32_OFF32 


POSIX V6 ILP32 OFFBIG | int、long 和 pointer 类 型 是 32 位 ，off_t 类 型 至 少 是 64 位 | SC V6 ILP32 OFFBIG 
_POSIX_V6_LP64_OFF64 int 类 型 是 32 位 ，long、pointer 和 off_t 类 型 是 64 位 | SC V6 LP64 OFF64 
_POSIX_V6_LP64_OFFBIG | int 类 型 是 32 位 ，long、pointer 和 off_t 类 型 至 少 是 64 位 | SC V6 LP64 OFFBIG 








c99 编 译 器 要 求 使 用 getconf(1) 命 令 , 将 所 希望 的 数据 大 小 模型 映射 为 编译 和 连接 程序 所 
需 的 标志 。 根 据 每 个 平台 支持 环境 的 不 同 ， 可 能 需要 不 同 的 标志 和 库 。 

不 幸 的 是 ， 在 这 一 方面 ， 实 现 没有 跟 上 标准 的 步伐 。 使 人 更 迷惑 不 解 的 是 Single UNIX 
Specification 第 2 版 和 第 3 版 之 间 更 改 了 若干 个 名 字 。 

为 了 避 开 这 一 点 ， 应 用 程序 可 将 符号 常量 _FILE_OFFSET_BITS 设 置 为 64， 以 支持 64 位 偏 移 量 。 
这 样 处 理 后 就 将 off 上 定义 更 改 为 64 位 带 符 号 整 型 。 将 _FITLE_OFFSET BITS 符 号 常量 设置 为 32， 就 支 
持 32 位 文件 偏 移 量 。 但 是 ， 应 当知 道 的 是 : 虽然 本 书 讨论 的 四 种 平台 都 支持 32 位 和 64 位 文件 偏 移 量 ， 
其 方法 是 将 _FILE OFFSET _BITS 符 号 常量 设置 为 所 希望 的 值 ， 但 并 不 保证 这 是 可 移植 的 。 


注意 : 尽管 可 以 支持 64 位 文件 偏 移 量 ， 但 是 否 能 创建 一 个 大 于 2 TB (2 一 1 个 字 节 ) 的 文件 
则 依赖 于 底层 文件 系统 的 类 型 。 


3.7 read 函 数 
调用 read 函 数 从 打开 文件 中 读数 据 。 


#include <unistd.h> 


ssize_t read(int filedes, void *buf, size t nbytes) ; 


BEA: 若 成 功 则 返回 读 到 的 字 节 数 ， 若 已 到 文件 结尾 则 返回 0， 若 出 错 则 返回 一 1 





如 read 成 功 ， 则 返回 读 到 的 字 节 数 。 如 已 到 达 文件 结尾 ， 则 返回 0。 
有 多 种 情况 可 使 实际 读 到 的 字 节 数 少 于 要 求 读 的 字 节 数 : 
。 读 普通 文件 时 ， 在 读 到 要 求 字 节 数 之 前 已 到 达 了 文件 尾 端 。 例 如 ， 若 在 到 达 文 件 尾 端 之 
前 还 有 30 个 字 节 ， 而 要 求 读 100 个 字 节 ， 则 reagd 返 回 30， 下 一 次 再 调用 read 时 ， 它 将 返 
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回 0 (文件 尾 端 ) 。 

， 当 从 终端 设备 读 时 ， 通 常 一 次 最 多 读 一 行 (第 18 章 将 介绍 如 何 改变 这 一 点 )。 

* 当 从 网 络 读 时 ， 网 络 中 的 缓冲 机 构 可 能 造成 返回 值 小 于 所 要 求 读 的 字 节 数 。 

。 当 从 管道 或 FIFO 读 时 ， 如 车 管 道 包含 的 字 节 少 于 所 需 的 数量 ， 那 么 reaG 将 只 返回 实际 可 
用 的 字 节 数 。 

* 当 从 某 些 面向 记录 的 设备 〈 例 如 磁带 ) 读 时 ， 一 次 最 多 返回 一 个 记录 。 

“ 当 某 一 信号 造成 中 断 ， 而 已 经 读 了 部 分 数据 量 时 。 我 们 将 在 10.5 节 进一步 讨论 此 种 情况 。 
读 操作 从 文件 的 当前 偏 移 量 处 开始 ， 在 成 功 返 回 之 前 ， 该 偏 移 量 将 增加 实际 读 到 的 字 节 数 。 
POSIX.1 从 几 个 方面 对 read 函 数 的 原型 作 了 更 改 。 其 经 典 定义 是 : 


int read(int filedes, char *buf, unsigned nbytes) ; 


* 8. ATSISO C 保 持 一 致 ， 将 第 二 个 参数 由 char * 改 为 void *。 在 ISO C 中 ， 类 型 
void * 用 于 表示 通用 指针 。 

* 其 次 ， 其 返回 值 必 须 是 一 个 带 符号 整数 (ssize_t)， 以 返回 正字 节 数 、0 (表示 文件 尾 
端 ) 或 -1 (出 错 ) 。 

。 最 后 ， 第 三 个 参数 在 历史 上 是 一 个 不 带 符号 整数 ， 这 允许 一 个 16 位 的 实现 一 次 读 或 写 的 
数据 可 以 多 达 65 534 个 字 节 。 在 1990 POSIX.1 标 准 中 ， 引 入 了 基本 系统 数据 类 型 
ssize_t 以 提供 带 符号 的 返回 值 ， 不 带 符号 的 size_t 则 用 于 第 三 个 参数 (112.525 
的 SSIZE_MAX 常 量 )。 


3.8 write 函数 
调用 write 函 数 向 打开 的 文件 写 数 据 。 


#include <unistd.h> 


ssize t write(int filedes, const void *buf, size t nbytes); 





返回 值 : 车 成 功 则 返回 已 写 的 字 节 数 ， 若 出 错 则 返回 -1 


其 返回 值 通常 与 参数 mpytes 的 值 相 同 ， 否 则 表示 出 错 。wzite 出 错 的 一 个 常见 原因 是 : 磁 
盘 已 写 满 ， 或 者 超过 了 一 个 给 定 进程 的 文件 长 度 限制 ( 见 7.11 节 及 习题 10.11)。 

对 于 普通 文件 ， 写 操作 从 文件 的 当前 偏 移 量 处 开始 。 如 果 在 打开 该 文件 时 ， 指 定 了 
O_APPEND 选 项 ， 则 在 每 次 写 操 作 之 前 ， 将 文件 偏 移 量 设置 在 文件 的 当前 结尾 处 。 在 一 次 成 功 
写 之 后 ， 该 文件 偏 移 量 增加 实际 写 的 字 节 数 。 


3.9 1/O 的 效率 


程序 清单 3-3 中 的 程序 使 用 read 和 write 函 数 复制 一 个 文件 。 关 于 该 程 序 应 注意 下 列 各 点 : 
。 它 从 标准 输入 读 ， 写 至 标准 输出 ， 这 就 假定 在 执行 本 程序 之 前 ， 这 些 标准 输入 、 输 出 已 
由 shell 安 排 好 。 确 实 ， 所 有 常用 的 UNIX 系 统 sheli 都 提供 一 种 方法 ， 它 在 标准 输入 上 打开 
一 个 文件 用 于 读 ， 在 标准 输出 上 创建 (或 重 写 ) 一 个 文件 。 这 使 得 程序 不 必 自 行 打开 输 
入 和 输出 文件 。 

很 多 应 用 程序 假定 标准 输入 是 文件 描述 符 0， 标 准 输出 是 文件 描述 符 1。 本 示例 中 则 使 用 
在 <unistd.h> 中 定义 的 两 个 名 字 : STDIN_FILENO 和 STDOUT_FILENO。 
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“考虑 到 进程 终止 时 ，UNIX 系 统 内 核 会 关闭 读 进 程 的 所 有 打开 的 文件 描述 符 ， 所 以 此 示例 
并 不 会 关闭 输入 和 输出 文件 。 

“对 UNIX 系 统 内 核 而 言 ， 文 本 文件 和 二 进 制 代码 文件 并 无 区 别 ， 所 以 本 示例 对 这 两 种 文件 
都 能 工作 。 


程序 清单 3-3 将 标准 输入 复制 到 标准 输出 


#include "apue.h" 
#define BUFFSIZE 4096 
int 

main (void) 


int n; 
char buf [BUFFSIZE]; 


while ((n = read(STDIN FILENO, buf, BUFFSIZE)) > 0) 
if (write(STDOUT FILENO, buf, n) != n) 
err sys("write error"); 


if (n « 0) 
err Bys("read error"); 


exit(0); 


) 


我 们 没有 回答 的 一 个 问题 是 如 何 选取 BUFFSIZE 值 。 在 回答 此 问题 之 前 ， 让 我 们 先 用 各 种 
不 同 的 BUFFSIZE 值 来 运行 此 程序 。 表 3-2 显 示 了 用 20 种 不 同 的 缓冲 区 长 度 ， 读 103 316 352 字 节 
的 文件 所 得 到 的 结果 。 


表 3-2 用 不 同 缓冲 区 长 度 进行 读 操作 的 计时 结果 


| 用 户 CPU (M) | 系统 CPU (M) | 时 钟 时 间 (E) | 循环 次 数 


103 316 352 
51 658 176 
25 829 088 
12 914 544 

6457 272 

3 228 636 

1614318 

807 159 

403 579 

512 201 789 

1 024 : 100 894 
2 048 50 447 
4 096 25 223 
8192 12611 
16 384 6 305 
32 768 ; 3152 
65 536 1576 

131 072 . f 788 

262 144 394 

524 288 . 198 
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用 程序 清单 3-3 中 的 程序 读 文件 ， 其 标准 输出 被 重新 定向 到 /dev/null 上 。 此 测试 所 用 的 
文件 系统 是 Linux ext2 文 件 系统 ， 其 块 长 为 4 096 字 节 ( 块 长 由 st_blksize 表 示 ， 在 4.12 节 中 
说 明 其 值 为 4 096) 。 系 统 CPU 时 间 的 最 小 值 出 现在 BUFFSIZE 为 4096 处 ， 继 续 增 加 缓冲 区 长 度 
对 此 时 间 几 乎 没有 影响 。 

大 多 数 文件 系统 为 改善 其 性 能 都 采用 某 种 预 读 (read ahead) 技术 。 当 检测 到 正 进 行 顺 序 读 
取 时 ， 系 统 就 试图 读 入 比 应 用 程序 所 要 求 的 更 多 数据 ， 并 假想 应 用 程序 很 快 就 会 读 这 些 数据 。 
从 表 3-2 中 最 后 几 个 记录 项 可 以 观察 到 ， 在 ext2 中 ， 当 BUFFSIZE 为 128 KB 后 ， 预 读 停止 了 ， 
这 对 读 操作 的 性 能 产生 了 影响 。 

我 们 以 后 还 将 回 到 这 一 实例 上 。3.14 节 将 用 此 说 明 同 步 写 的 效果 ，5.8 节 将 比较 不 带 缓冲 的 
LO 时 间 与 标准 LO 库 所 用 的 时 间 。 


应 当 了 解 ， 在 什么 时 间 对 实施 文件 读 、 写 操作 的 程序 进行 性 能 度量 。 操 作 系 统 试图 用 缓存 技术 将 
相关 文件 放置 在 主 存 中 ， 所 以 如 若 重复 度量 程序 性 能 ， 那 么 后 续 运行 该 程序 所 得 到 的 计时 很 可 能 好 于 
第 一 次 。 其 原因 是 。 第 一 次 运行 使 文件 进入 系统 缓存 ,后续 各 次 运行 一 般 从 系统 丝 存 访问 文件 ， 而 无 
RR, SÉ. 

在 表 3-2 所 示 的 测试 数据 中 . 每 次 运行 使 用 不 同 的 缓冲 区 大 小 和 不 同 的 文件 副本 ， 所 以 前 一 次 运行 
在 线 存 中 留 下 的 数据 是 后 一 次 运行 所 不 需要 的 ， 搁 言 之 ,后 一 次 运行 不 会 在 线 存 中 找到 它 所 需要 的 数 
据 。 这 些 文件 都 足够 大 ， 不 可 能 全 部 保留 在 线 存 中 (测试 系统 配置 了 512 MB RAM), 


3.10 文件 共享 


UNIX 系 统 支 持 在 不 同 进程 间 共 享 打开 的 文件 。 在 介绍 up 函数 之 前 ， 先 要 说 明 这 种 共享 。 
为 此 先 介绍 内 核 用 于 所 有 IO 的 数据 结构 。 


下 面 的 说 明 是 概念 性 的 ， 与 特定 实现 可 能 匹配 ， 也 可 能 不 匹配 。 和 参阅 Bachf1986] 对 系统 V 中 相关 数 
据 结构 的 讨论 。McKusick 等 人 [1996] 说 明了 4.4BSD 中 的 相关 数据 结构 。McKusick 和 Neville-Neil[2005] 
对 FreeBSD 5.2 进 行 了 介绍 。 对 Solaris 的 类 似 讨论 条 见 Marno 和 McDougall[2001]。 


内 核 使 用 三 种 数据 结构 表示 打开 的 文件 ， 它 们 之 间 的 关系 决定 了 在 文件 共享 方面 一 个 进程 
对 另 一 个 进程 可 能 产生 的 影响 。 
(1) 每 个 进程 在 进程 表 中 都 有 一 个 记录 项 ， 记 录 项 中 包含 有 一 张 打 开 文 件 描述 符 表 ， 可 将 
其 视 为 一 个 矢量 ， 每 个 描述 符 占 用 一 项 。 与 每 个 文件 描述 符 相 关联 的 是 ; 
(a) 文件 描述 符 标 志 (close_on_exec， 参 见 图 3-1 和 3.14 节 ) 。 
(b) 指向 一 个 文件 表 项 的 指针 。 
(2) 内 核 为 所 有 打开 文件 维持 一 张 文 件 表 。 每 个 文件 表 项 包含 .: 
(a) 文件 状态 标志 (〈 读 、 写 、 添 写 、 同 步 和 非 阻 塞 等 ， 关 于 这 些 标志 的 更 多 信息 参见 
3.1455), 
(b) 当前 文件 偏 移 量 。 
(c) 指向 该 文件 v 节 点 表 项 的 指针 。 
(3) 每 个 打开 文件 (或 设备 ) 都 有 一 个 v 节 点 (v-node) 结构 。v 节 点 包含 了 文件 类 型 和 对 此 
文件 进行 各 种 操作 的 函数 的 指针 。 对 于 大 多 数 文件 ，v 节 点 还 包含 了 该 文件 的 i 节点 (i-node, 
索引 节点 )。 这 些 信息 是 在 打开 文件 时 从 磁盘 上 读 入 内 存 的 ， 所 以 所 有 关于 文件 的 信息 都 是 快 
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速 可 供 使 用 的 。 例 如 ，i 节 点 包含 了 文件 的 所 有 者 、 文 件 长 度 、 文 件 所 在 的 设备 、 指 向 文件 实际 
数据 块 在 磁盘 上 所 在 位 置 的 指针 等 等 (4.14 节 较 详细 地 说 明了 典型 UNIX 系 统 文件 系统 ， 并 将 更 
多 地 介绍 i 节点 )。 


Linux 没 有 使 用 v 节 点 ， 而 是 使 用 了 通用 i 节点 结构 。 虽 然 两 种 实现 有 所 不 同 ， 但 在 概念 上 ，v 节 点 
与 节点 是 一 样 的 。 两 者 都 指向 文件 系统 特有 的 i 节点 结构 。 


我 们 忽略 了 某 些 实现 细节 ， 但 这 并 不 影响 我 们 的 讨论 。 例 如 ， 打 开 文 件 描述 符 表 可 存放 在 
用 户 空间 ， 而 非 进程 表 中 。 这 些 表 也 可 以 用 多 种 方式 实现 ， 不 必 一 定 是 数组 ， 例 如 ， 可 将 它们 
实现 为 结构 的 链接 表 。 这 些 细节 并 不 影响 我 们 在 文件 共享 方面 的 讨论 。 

图 3-1 显 示 了 一 个 进程 的 三 张 表 之 间 的 关系 。 该 进程 有 两 个 不 同 的 打开 文件 : 一 个 文件 打开 
为 标准 输入 (文件 描述 符 0)， 另 一 个 打开 为 标准 输出 (文件 描述 符 为 1)。 从 UNIX 系 统 的 早期 版 
本 [Thompson 1978] 以 来 ， 这 三 张 表 之 间 的 基本 关系 一 直 保 持 至 今 。 这 种 安排 对 于 在 不 同 进程 之 
间 共 享 文件 的 方式 非常 重要 。 在 以 后 的 章节 中 涉及 其 他 文件 共享 方式 时 还 会 回 到 这 张 图 上 来 。 

进程 表 项 文件 表 

| 文件 状态 标志 | 


v 节 点 表 
















fd 标志 文件 指针 












文件 状态 标志 
当前 文件 偏 移 量 
v 节 点 指针 














当前 文件 长 度 
图 3-1 打开 文件 的 内 核 数据 结构 


创建 v 节 点 结构 的 目的 是 对 在 一 个 计算 机 系统 上 的 多 文件 系统 类 型 提供 支持 。 这 一 工作 是 由 Peter 
Weinberger (H REEE) 和 Bill Joy (Sun 公 司 ) 分 别 独立 完成 的 。Sun 称 此 种 文件 系统 为 虚拟 文件 系 
% (Virtual File System) ， 称 与 文件 系统 类 型 无 关 的 i 节 点 部 分 为 v 节 点 [Kleiman 1986]。 当 各 个 制造 商 的 
实现 增加 了 对 Sun 的 网 络 文件 系统 (NFS) 的 支持 时 ， 它 们 都 广泛 采用 了 v 节 点 结构 。 在 BSD 系 列 中 首 
先 提供 v 节 点 的 是 4.3BSD Reno 版 本 ， 其 中 加 入 了 NFS 。 


在 SVR4 中 ，V 节 点 代 撞 了 SVR3 中 与 文件 系统 类 型 无 关 的 i 节点 结构 。Solaris 是 从 SVR4 发 展 而 来 的 ， 
它 也 使 用 Vv 节点 。 


Linux 没 有 将 相关 数据 结构 分 为 1 节点 和 Vv 节点 ， 而 是 采用 了 一 个 独立 于 文件 系统 的 i 节点 和 一 个 依赖 
于 文件 系统 的 i 节点 。 


如 果 两 个 独立 进程 各 自打 开 了 同一 个 文件 ， 则 有 图 3-2 中 所 示 的 安排 。 我 们 假定 第 一 个 进程 
在 文件 描述 符 3 上 打开 该 文件 ， 而 另 一 个 进程 则 在 文件 描述 符 4 上 打开 该 文件 。 打 开 访 文件 的 每 
个 进程 都 得 到 一 个 文件 表 项 ， 但 对 一 个 给 定 的 文件 只 有 一 个 v 节 点 表 项 。 每 个 进程 都 有 自己 的 
文件 表 项 的 一 个 理由 是 : 这 种 安排 使 每 个 进程 都 有 它 自 己 的 对 该 文件 的 当前 偏 移 量 。 

给 出 了 这 些 数据 结构 后 ， 现 在 对 前 面 所 述 的 操作 作 进 一 步 说 明 。 

* 在 完成 每 个 write 后 ， 在 文件 表 项 中 的 当前 文件 偏 移 量 即 增加 所 写 的 字 节 数 。 如 果 这 使 
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当前 文件 偏 移 量 超过 了 当前 文件 长 度 ， 则 在 i 节点 表 项 中 的 当前 文件 长 度 被 设置 为 当前 文 

件 偏 移 量 (也 就 是 该 文件 加 长 了 )。 

。 如 果 用 0_APPEND 标 志 打 开 了 一 个 文件 ， 则 相应 标志 也 被 设置 到 文件 表 项 的 文件 状态 标 

志 中 。 每 次 对 这 种 具有 添 写 标志 的 文件 执行 写 操作 时 ， 在 文件 表 项 中 的 当前 文件 偏 移 量 

首先 被 设置 为 i 节点 表 项 中 的 文件 长 度 。 这 就 使 得 每 次 写 的 数据 都 添加 到 文件 的 当前 尾 

端 处 。 

* 若 一 个 文件 用 1seek 定 位 到 文件 当前 的 尾 端 ， 则 文件 表 项 中 的 当前 文件 偏 移 量 被 设置 为 i 

节点 表 项 中 的 当前 文件 长 度 。( 注 意 ， 这 与 用 oO_APPEND 标 志 打开 文件 是 不 同 的 ， 详 见 
3.11 节 。) 

“1seek 函 数 只 修改 文件 表 项 中 的 当前 文件 偏 移 量 ， 没 有 进行 任何 MO 操作 。 


进程 表 项 


[|  —— ] 


fa 标志 文件 指针 
fd 1: 文件 表 
d 

vA 















当前 文件 大 小 






当前 文件 偏 移 量 
v 节 点 指针 








图 3-2 两 个 独立 进程 各 自打 开 同 一 个 文件 


可 能 有 多 个 文件 描述 符 项 指向 同一 文件 表 项 。 在 3.12 节 中 讨论 dup 函 数 时 ， 我 们 就 能 看 到 
这 一 点 。 在 fork 后 也 会 发 生 同 样 的 情况 ， 此 时 父 、 子 进程 对 于 每 一 个 打开 文件 描述 符 共享 同 
一 个 文件 表 项 ( 见 8.3 节 )。 

注意 ， 文 件 描述 符 标志 和 文件 状态 标志 在 作用 域 方面 的 区 别 ， 前 者 只 用 于 一 个 进程 的 一 个 
描述 符 ， 而 后 者 则 适用 于 指向 该 给 定 文件 表 项 的 任何 进程 中 的 所 有 描述 符 。 在 3.14 节 说 明 
fcnt1 函 数 时 ， 我 们 将 会 了 解 如 何 获取 和 修改 文件 描述 符 标 志和 文件 状态 标志 。 

本 节 上 面 所 述 的 一 切 对 于 多 个 进程 读 同一 文件 都 能 正确 工作 。 每 个 进程 都 有 它 自己 的 文件 
表 项 ， 其 中 也 有 它 自己 的 当前 文件 偏 移 量 。 但 是 ， 当 多 个 进程 写 同一 个 文件 时 ， 则 可 能 产生 预 

期 不 到 的 结果 。 为 了 说 明 如 何 避 免 这 种 情况 ， 需 要 理解 原子 操作 的 概念 。 
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3.11 原子 操作 


1. 添 写 至 一 个 文件 
考虑 一 个 进程 ， 它 要 将 数据 添加 到 一 个 文件 尾 端 。 早 期 的 UNIX 系 统 版 本 并 不 支持 open 的 
O_APPEND 选 项 ， 所 以 程序 被 编写 成 下 列 形式 ; 


if (lseek(fd, OL, 2) < 0) /* position to EOF */ 
err_sys("lseek error") ; 
if (write(fd, buf, 100) != 100) /* and write */ 


err_sys("write error") ; 


对 单个 进程 而 言 ， 这 段 程序 能 正常 工作 ， 但 若 有 多 个 进程 同时 使 用 这 种 方法 将 数据 添加 到 
同一 文件 ， 则 会 产生 问题 。( 例 如 ， 若 此 程序 由 多 个 进程 同时 执行 ， 各 自 将 消息 添加 到 一 个 日 
志文 件 中 ， 就 会 产生 这 种 情况 。) 

假定 有 两 个 独立 的 进程 A 和 B 都 对 同一 文件 进行 添加 操作 。 每 个 进程 都 已 打开 了 该 文件 ， 
但 未 使 用 oO_APPEND 标 志 。 此 时 ， 各 数据 结构 之 间 的 关系 如 图 3-2 中 所 示 。 每 个 进程 都 有 它 自 己 
的 文件 表 项 ， 但 是 共享 一 个 v 节 点 表 项 。 假 定 进程 A 调 用 了 1seek， 它 将 进程 A 的 该 文件 当前 偏 
移 量 设置 为 1500 字 节 (当前 文件 尾 端 处 ) 。 然 后 内 核 切换 进程 使 进程 8 运行。 进程 B 执 行 1seek， 
也 将 其 对 该 文件 的 当前 偏 移 量 设置 为 1500 字 节 (当前 文件 尾 端 处 ) 。 然 后 B 调 用 write， 它 将 B 
的 该 文件 当前 文件 偏 移 量 增 至 1600。 因 为 该 文件 的 长 度 已 经 增加 了 ， 所 以 内 核对 v 节 点 中 的 当 
前 文件 长 度 更 新 为 1600。 然 后 ， 内 核 又 进行 进程 切换 使 进程 A 恢复 运行 。 当 A 调用 write 了 时 ， 
就 从 其 当前 文件 偏 移 量 (1500 字 节 ) 处 将 数据 写 到 文件 中 去 。 这 样 也 就 代 换 了 进程 B 刚 写 到 该 
文件 中 的 数据 。 

问题 出 在 逻辑 操作 “定位 到 文件 尾 端 处 ， 然 后 写 ” 上 ， 它 使 用 了 两 个 分 开 的 函数 调用 。 解 
决 问题 的 方法 是 使 这 两 个 操作 对 于 其 他 进程 而 言 成 为 一 个 原子 操作 。 任 何 一 个 需要 多 个 函数 调 
用 的 操作 都 不 可 能 是 原子 操作 ， 因 为 在 两 个 函数 调用 之 间 ， 内 核 有 可 能 会 临时 挂 起 该 进程 (E 
如 我 们 前 面 所 假定 的 ) 。 

UNIX 系 统 提 供 了 一 种 方法 使 这 种 操作 成 为 原子 操作 ， 该 方法 是 在 打开 文件 时 设置 
O_RAPPEND 标 志 。 正 如 前 一 节 中 所 述 ， 这 就 使 内 核 每 次 对 这 种 文件 进行 写 之 前 ， 都 将 进程 的 当 
前 偏 移 量 设 置 到 该 文件 的 尾 端 处 ， 于 是 在 每 次 写 之 前 就 不 再 需要 调用 1 seek。 

2. pread#lpwriteri 

Single UNIX Specification 包 括 了 XSI 扩 展 ， 该 扩展 允许 原子 性 地 定位 搜索 (seek) 和 执行 
VO。pread 和 pwrite 就 是 这 种 扩展 。 


#include <unistd.h> 
ssize_t pread(int filedes, void *buf, size t nbytes, off t offset); 


返回 值 : 读 到 的 字 节 数 ， 若 已 到 文件 结尾 则 返回 0， 若 出 错 则 返回 -1 


ssize t pwrite(int filedes, const void *buf, size t nbytes, off t offset); 


返回 值 : 车 成 功 则 返回 已 写 的 字 节 数 ， 若 出错 则 返回 -1 





调用 pread 相 当 于 顺序 调用 lseek 和 read, 但 是 pread 又 与 这 种 顺序 调用 有 下 列 重要 区 别 ; 
* 调用 preaq 时 ， 无 法 中 断 其 定位 和 读 操作 。 
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。 不 更 新 文件 指针 。 

调用 pwrite 相 当 于 顺序 调用 lseek 和 write， 但 也 与 它们 有 类 似 的 区 别 。 

3. 创建 一 个 文件 

在 对 open 函 数 的 0_CREAT 和 0_EXCL 选 项 进行 说 明 时 ， 我 们 已 见 到 另 一 个 有 关 原 子 操作 的 
例子 。 当 同时 指定 这 两 个 选项 ， 而 该 文件 又 已 经 存在 时 ，open 将 失败 。 我 们 曾 提 及 检查 该 文 
件 是 否 存在 以 及 创建 该 文件 这 两 个 操作 是 作为 一 个 原子 操作 执行 的 。 如 果 没 有 这 样 一 个 原子 操 
作 ， 那 么 可 能 会 编写 下 列 程序 段 ， 


if ((fd = open(pathname, O WRONLY)) < 0) { 
if (errno == ENOENT) { 
if ((fd = creat (pathname, mode)) < 0) 
err_sys ("creat error"); 
} else { 
err sys("open error"); 
) 


) 

如 果 在 open 和 creat 之 间 ， 另 一 个 进程 创建 了 该 文件 ， 那 么 就 会 引起 问题 。 例 如 ， 若 在 
这 两 个 函数 调用 之 间 ， 另 一 个 进程 创建 了 该 文件 ， 并 且 写 进 了 一 些 数据 ， 然 后 ， 原 先 的 进程 执 
行 这 段 程序 中 的 creat ， 这 时 ， 刚 由 另 一 个 进程 写 上 去 的 数据 就 会 被 控 去 。 如 若 将 这 两 者 合并 
在 一 个 原子 操作 中 ， 这 种 问题 也 就 不 会 产生 。 

一 般 而 言 ， 原 子 操作 (atomic operation) 指 的 是 由 多 步 组 成 的 操作 。 如 果 该 操作 原子 地 执 
行 ， 则 要 么 执行 完 所 有 步骤 ， 要 么 一 步 也 不 执行 ， 不 可 能 只 执行 所 有 步骤 的 一 个 子 集 。 在 4.15 
节 论 述 1ink 函 数 以 及 在 14.3 节 中 说 明 记录 锁 时 ， 还 将 讨论 原子 操作 。 


3.12 dupAldup2 mx 
下 面 两 个 函数 都 可 用 来 复制 一 个 现存 的 文件 描述 符 : 


#include <unistd.h> 


int dup(int filedes) ; 


int dup2 (int filedes, int filedes2) ; 


两 函数 的 返回 值 ， 若 成 功 则 返回 新 的 文件 描述 符 ， 若 出 错 则 返回 一 1 





由 dup 返 回 的 新 文件 描述 符 一 定 是 当前 可 用 文件 描述 符 中 的 最 小 数值 。 用 dup2 则 可 以 用 
filedes2 参 数 指定 新 描述 符 的 数值 。 如 果 filedes2 已 经 打开 ， 则 先 将 其 关闭 。 如 车 filedes 等 于 
filedes2， 则 dup2 返 回 filedes2， 而 不 关闭 它 。 
这 些 函 数 返 回 的 新 文件 描述 符 与 参数 filedes 共 享 同 一 个 文件 表 项 。 图 3-3 显 示 了 这 种 情况 。 
在 此 图 中 ， 我 们 假定 进程 执行 了 ， 


newfd = dup(1); 


当 此 函数 开始 执行 时 ， 假 定 下 一 个 可 用 的 描述 符 是 3 (这 是 非常 可 能 的 ， 因 为 0、1 和 2 由 shell 打 
开 )。 因 为 两 个 描述 符 指向 同一 文件 表 项 ， 所 以 它们 共享 同一 文件 状态 标志 ( 读 、 写 、 添 写 等 ) 
以 及 同一 当前 文件 偏 移 量 。 

每 个 文件 描述 符 都 有 它 自己 的 一 套 文件 描述 符 标志 。 正 如 我 们 将 在 下 一 节 中 说 明 的 那样， 
新 描述 符 的 执行 时 关闭 (close-on-exec) 标志 总 是 由 dup 函 数 清除 。 
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进程 表 项 










X v 节 点 表 
fd 标志 文件 指针 





当前 文件 大 小 








图 3-3 执行 Gup(D) 后 的 内 核 数据 结构 


复制 一 个 描述 符 的 另 一 种 方法 是 使 用 fcnt1 函 数 ，3.14 节 将 对 该 函数 进行 说 明 。 实 际 上 ， 
调用 


dup (filedes) ; 


等 效 于 

fcntl(filedes, F DUPFD, 0); 
而 调用 

dup2(filedes, filedes2) ; 
等 效 于 


close (filedes2) ; 
fcntl(filedes, F DUPFD, filedes2) ; 


在 后 一 种 情况 下 ，dqup2 并 不 完全 等 同 于 close 加 上 fcnt1。 它 们 之 间 的 区 别 是 : 

(1) aup2 是 一 个 原子 操作 ， 而 close 及 fcnt1 则 包括 两 个 函数 调用 。 有 可 能 在 close 和 
fcnt1 之 间 插 入 执行 信号 捕获 函数 ， 它 可 能 修改 文件 描述 符 〈 第 10 章 将 说 明 信 和 号 ) 。 

(2) Gup2 和 fcnt1 有 某 些 不 同 的 errno。 


dup2 系 统 调 用 起 源 于 V7， 然 后 传播 至 所 有 BSD 版 本 。 而 复制 文件 描述 符 的 Ecnt1 方 法 则 首先 由 系 
统 II 使 用 ， 然 后 由 系统 V 继 续 采 用 。SVR3.2 选 用 了 dup2 函 数 ，4.2BSD 则 选用 了 fcnt1 函 数 及 F_DUPFD 
功能 。POSIX.1 要 求 羔 有 dup2 及 fcntl 的 F_DUPFD 功 能 。 


3.13 sync、fsync 和 fdatasync 函 数 


传统 的 UNIX 实 现在 内 核 中 设 有 缓冲 区 高 速 缓存 或 页 面 高 速 缓存 ， 大 多 数 磁盘 IO 都 通过 组 
冲 进 行 。 当 将 数据 写 入 文件 时 ， 内 核 通 当 先 将 该 数据 复制 到 其 中 一 个 缓冲 区 中 ， 如 果 该 缓冲 区 
尚未 写 满 ， 则 并 不 将 其 排 人 输出 队列 ， 而 是 等 待 其 写 满 或 者 当 内 核 需要 重用 该 缓冲 区 以 便 存放 
其 他 磁盘 块 数据 时 ， 再 将 该 缓冲 排 人 输出 队列 ， 然 后 待 其 到 达 队 首 时 ， 才 进行 实际 的 MO 操作 。 
这 种 输出 方式 被 称 为 延迟 写 (delayed write) (Bach [1986] 第 3 章 详 细 讨 论 了 缓冲 区 高 速 缓存 ) 。 

延迟 写 减少 了 磁盘 读 写 次 数 ， 但 是 却 降低 了 文件 内 容 的 更 新 速度 ， 使 得 欲 写 到 文件 中 的 数 
据 在 一 段 时 间 内 并 没有 写 到 磁盘 上 。 当 系统 发 生 故 障 时 ， 这 种 延迟 可 能 造成 文件 更 新 内 容 的 丢 
失 。 为 了 保证 磁盘 上 实际 文件 系统 与 缓冲 区 高 速 缓存 中 内 容 的 一 致 性 ，UNIX 系 统 提供 了 sync、 
fsync#lfdatasync=7 AR, 
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#include <unistd.h> 


int fsync(int filedes) ; 


int fdatasync (int filedes) ; 


返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 -1 


void sync (void); 





sync 畏 数 只 是 将 所 有 修改 过 的 块 缓冲 区 排 入 写 队 列 ， 然 后 就 返回 ， 它 并 不 等 待 实际 写 磁 
盘 操 作 结束 。 

通常 称 为 update 的 系统 守护 进程 会 周期 性 地 (一 般 每 隔 30 秒 ) 调用 sync 函 数 。 这 就 保证 
了 定期 冲洗 内 核 的 块 缓冲 区 。 命 令 sync (1) 也 调用 sync 函 数 。 

fsync 函 数 只 对 由 文件 描述 符 fiiedes 指 定 的 单一 文件 起 作用 ， 并 且 等 待 写 磁盘 操作 结束 ， 
然后 返回 。fsync 可 用 于 数据 库 这 样 的 应 用 程序 ， 这 种 应 用 程序 需要 确保 将 修改 过 的 块 立即 写 
到 磁盘 上 。 

fdatasync 函 数 类 似 于 fsync， 但 它 只 影响 文件 的 数据 部 分 。 而 除数 据 外 ，fsync 还 会 
同步 更 新 文件 的 属性 。 


本 书 说 明 的 所 有 四 种 平台 都 支持 sync 和 fsync 函 数 。 但 是 ，FreeBSD 5.2.1 和 Mac OS X 10.3 并 不 支 
持 fdatasync。 


3.14 fcnt1 函 数 
fcnt1 畏 数 可 以 改变 已 打开 的 文件 的 性 质 。 


#include «fcntl.h» 


int fcntl(int filedes, int cmd, ... /* int arg */ ); 


返回 值 ， 若 成 功 则 依赖 于 cmd ( 见 下 )， 若 出 错 则 返回 -1 


在 本 节 的 各 实例 中 ,第 三 个 参数 总 是 一 个 整数 ， 与 上 面 所 示 函 数 原型 中 的 注释 部 分 相对 应 。 
但 是 在 14.3 节 说 明 记录 锁 时 ， 第 三 个 参数 则 是 指向 一 个 结构 的 指针 。 
fcnt1 函 数 有 5 种 功能 : 
(1) 复制 一 个 现 有 的 描述 符 (cmd=F_DUPFD), 
(2) 获得 /设置 文件 描述 符 标记 (cmd = F_GETFD 或 F_SETFD)。 
(3) 获得 /设置 文件 状态 标志 (cmd = F_GETFL 或 F_SETFL)。 
(4) 获得 /设置 异步 WO 所 有 权 (cmd = F_GETOWN 或 F_SETOWN)。 
(5) 获得 /设置 记录 锁 (cmd-F GETLK, F SETLKEEF SETLKW), 
我 们 先 说 明 这 10 种 cmd 值 中 的 前 7 种 (14.3 节 说 明 后 3 种 ， 它 们 都 与 记录 锁 有 关 )。 我 们 将 涉 
及 与 进程 表 项 中 各 文件 描述 符 相 关联 的 文件 描述 符 标 志 ， 以 及 每 个 文件 表 项 中 的 文件 状态 标志 
( 见 图 3-1)。 
F DUPFD 复制 文件 描述 符 filedes。 新 文件 描述 符 作为 函数 值 返回 。 它 是 尚未 打开 的 各 
描述 符 中 大 于 或 等 于 第 三 个 参数 值 ( 取 为 整 型 值 ) 中 各 值 的 最 小 值 。 新 描述 
符 与 filedes 共 享 同一 文件 表 项 ( 见 图 3-3)。 但 是 ， 新 描述 符 有 它 自己 的 一 套 文 
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件 描述 符 标 志 ， 其 FD_CLOEXEC 文 件 描述 符 标志 被 请 除 〈 这 表示 该 描述 符 在 

通过 一 个 exec 时 仍 保持 有 效 ， 我 们 将 在 第 8 章 对 此 进行 讨论 ) 。 
F_GETFD ”对 应 于 filedes 的 文件 描述 符 标志 作为 函数 值 返回 。 当 前 只 定义 了 一 个 文件 描 

述 符 标 志 FD_CLOEXEC。 i 
F_SETFD “对 于 jiiedes 设 置 文件 描述 符 标志 。 新 标志 值 按 第 三 个 参数 ( 取 为 整 型 值 ) 设置 。 


应 当 了 解 很 多 现 有 的 涉及 文件 描述 符 标 志 的 程序 并 不 使 用 常量 FD_CLOEXEC ， 而 是 将 此 标志 设置 
为 0 (系统 默认 ， 在 exec 时 不 关闭 ) 或 1 (在 exec 时 关闭 ) 。 


F GETFL ”对 应 于 filedes 的 文件 状态 标志 作为 函数 值 返回 。 在 说 明 open 函 数 时 ， 已 说 明 
了 文件 状态 标志 。 它 们 列 于 表 3-3 中 。 


表 3-3 fcnt1 的 文件 状态 标志 


文件 状态 标志 


O_RDONLY 只 读 打 开 
O_WRONLY 只 写 打开 
O_RDWR Aik, SHH 
O_APPEND 每 次 写 时 追加 


O_NONBLOCK 非 阻 塞 模式 

O SYNC 等 待 写 完 成 (数据 和 属性 ) 

O_DSYNC 等 待 写 完成 ( 仅 数据 ) 

O_RSYNC 同步 读 、 写 

O_FSYNC 等 待 写 完成 ( 仅 FreeBSD Fil Mac OS X) 
O_ASYNC 异步 IO ( 仅 FreeBSD 和 Mac OS X) 





不 幸 的 是 ， 三 个 访问 方式 标志 (0O_RDONLY、O_WRONLY 以 及 O_RDWR) 并 
不 各 占 1 位 (正如 前 述 ， 这 三 种 标志 的 值 分 别 是 9、1 和 2， 由 于 历史 原因 。 
这 三 种 值 互 斥 一 个 文件 只 能 有 这 三 种 值 之 一 )。 因 此 首先 必须 用 屏蔽 字 
O_ACCMODE 取 得 访问 模式 位 ， 然 后 将 结果 与 这 三 种 值 中 的 任 一 种 作 比 较 。 
F_SETFL 将 文件 状态 标志 设置 为 第 三 个 参数 的 值 ( 取 为 整 型 值 )。 可 以 更 改 的 几 个 标 
志 是 : O APPEND, O_NONBLOCK, O SYNC, O_DSYNC, O_RSYNC, 
O FSYNCÍÉIO ASYNC, 
F. GETOWN 取 当 前 接收 SIGIO 和 SIGURG 信 号 的 进程 ID 或 进程 组 ID。14.6.2 节 将 论述 这 
两 种 异步 WO 信和 号。 
F_SETOWN ”设置 接收 SIGIO 和 SIGURG 信 号 的 进程 DD 或 进程 组 ID。 正 的 arg 指 定 一 个 进 
程 ID， 负 的 arg 表 示 等 于 arg 绝 对 值 的 一 个 进程 组 ID。 
fcnt1 的 返回 值 与 命令 有 关 。 如 果 出 错 ， 所 有 命令 都 返回 -1， 如 果 成 功 则 返回 某 个 其 他 值 。 
下 列 四 个 命令 有 特定 返回 值 : F_DUPFD、F_GETFD、F_GETFL 以 及 F_GETOWN。 第 一 个 返回 新 
的 文件 描述 符 ， 接 下 来 的 两 个 返回 相应 标志 ， 最 后 一 个 返回 一 个 正 的 进程 ID 或 负 的 进程 组 ID。 


实 例 
程序 清单 3-4 中 的 程序 的 第 一 个 参数 指定 文件 描述 符 ， 并 对 于 该 描述 符 打印 其 所 选择 的 文件 
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标志 说 明 。 
程序 清单 3-4 对 于 指定 的 描述 符 打印 文件 标志 


#include "apue.h" 
#include «fcentl.h» 


int 
main(int argc, char *argv[}) 


{ 


int val; 


if (arge != 2) 
err quit("usage: a.out <descriptor#>"); 


if ((val = fentl(atoi(argv[1]), F GETFL, 0)) < 0) 
err _sys("fentl error for fd %d", atoi(argv[11)); 


switch (val & O ACCMODE) { 
case O RDONLY: 
printf ("read only"); 
break; 


case O_WRONLY: 
printf ("write only"); 
break; 


case O_RDWR: 
printf ("read write"); 
break; 


default: 
err dump ("unknown access mode"); 
} 


if (val & O_APPEND) 
printf(", append"); 
if (val & O NONBLOCK) 
printf(*, nonblocking"); 
#if defined(O SYNC) 
if (val & O SYNC) 
printf(", synchronous writes"); 
#endif 
#if !defined( POSIX C SOURCE) && defined (O_FSYNC) 
if (val & O FSYNC) 


printf(", synchronous writes"); 
#tendif 
putchar(’\n’); 
exit (0); 


} 


注意 ， 我 们 使 用 了 功能 测试 宏 _POSIX_C_sOURCE， 并 且 条 件 编译 了 POSIX.1 中 没有 定义 
的 文件 访问 标志 。 下 面 显示 了 从 bash (Bourne-again shell) 调用 该 程序 时 的 几 种 情况 。 当 使 用 
不 同 shell 时 ， 结 果 会 发 生变 化 。 


$ ./a.out 0 < /dev/tty 
read only 

$ ./a.out 1 > temp. foo 
$ cat temp. foo 

write only 

$ ./a.out 2 2>>temp. foo 
write only, append 
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$ ./a.out 5 5<>temp. foo 
read write 


子 句 5<>temp . foo 表 示 在 文件 描述 符 5 上 打开 文件 temp . foo 以 供 读 和 写 。 口 





在 修改 文件 描述 符 标 志 或 文件 状态 标志 时 必须 谨慎 ， 先 要 取得 现 有 的 标志 值 ， 然 后 根据 需 
要 修改 它 ， 最 后 设置 新 标志 值 。 不 能 只 是 执行 F_SETFD 或 F_SETFL 命 令 ， 这 样 会 关闭 以 前 设 
置 的 标志 位 。 

程序 清单 3-5 显 示 了 一 个 对 一 个 文件 描述 符 设置 一 个 或 多 个 文件 状态 标志 的 函数 。 


程序 清单 3-5 对 一 个 文件 描述 符 打开 一 个 或 多 个 文件 状态 标志 


#include "apue.n" 
#include <fentl hs 


void 
set_fl(int fd, int flags) /* flags are file status flags to turn on */ 


int val; 


if ((val = fentl(fd, F GETFL, 0)) < 0) 
err Sys("fcntl F GETFL error"); 


val |= flags; /* turn on flags */ 


if (fentl(fd, F SETFL, val) < 0) 
err Sys("fcntl F SETFL error"); 
) 


如 果 将 中 间 的 一 条 语句 改 为 ; 

val & “flags; /* turn flags off */ 
就 构成 另 一 个 函数 ， 我 们 称 其 为 clr*_f1， 并 将 在 后 面 某 个 例子 中 用 到 它 。 此 语句 使 当前 文件 
状态 标志 值 val 与 Elags 的 补 码 进行 逻辑 “与 ”运算 。 

如 果 在 程序 清单 3-5 的 开始 处 ， 加 上 下 面 一 行 以 调用 set_f1， 则 打开 了 同步 写 标志 。 


set fl(STDOUT FILENO, O SYNC); 


这 就 使 每 次 write 都 要 等 待 ， 直 至 数据 已 写 到 磁盘 上 再 返回 。 在 UNIX 系 统 中 ， 通 常 write 只 
是 将 数据 排 人 队列 ， 而 实际 的 写 磁 盘 操 作 则 可 能 在 以 后 的 某 个 时 刻 进 行 。 数 据 库 系 统 很 可 能 需 
要 使 用 o_SYNC， 这 样 一 来 ， 当 它 从 write 返回 时 就 知道 数据 已 确实 写 到 了 磁盘 上 ， 以 免 在 系 
统 崩溃 时 产生 数据 丢失 。 

程序 运行 了 时， 设置 0_SYNC 标 志 会 增加 时 钟 时 间 。 为 了 测试 这 一 点 ， 运 行程 序 清单 3-3， 它 
从 一 个 磁盘 文件 中 将 98.5 MB 字 节 的 数据 复制 到 另 一 个 文件 。 然 后 ， 在 此 程序 中 设置 0_sYNC 标 
志 ， 使 其 完成 上 述 同 样 的 工作 ， 以 便 将 两 者 的 结果 进行 比较 。 在 使 用 ext2 文 件 系统 的 Linux 系 
统 上 执行 上 述 操 作 ， 得 到 的 结果 见 表 3-4。 

表 3-4 中 的 6 行 都 是 在 BUFFSI2ZE 为 4096 的 情况 下 测量 得 到 的 。 表 3-2 中 的 结果 所 测量 的 情况 
是 读 一 个 磁盘 文件 ， 然 后 写 到 /dev/null， 所 以 没有 磁盘 输出 。 表 3-4 中 的 第 2 行 对 应 于 读 一 个 
磁盘 文件 ， 然 后 写 到 另 一 个 磁盘 文件 中 。 这 就 是 为 什么 表 3-4 中 第 1、2 行 有 差别 的 原因 。 在 写 
磁盘 文件 时 ， 系 统 时 间 增 加 了 ， 其 原因 是 内 核 需要 从 进程 中 复制 数据 ， 并 将 数据 排 人 队列 以 便 
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由 磁盘 驱动 器 将 其 写 到 磁盘 上 。 当 写 至 磁盘 文件 时 ， 我 们 期 望 时 钟 时 间 也 会 增加 ， 但 在 本 测试 
中 ， 它 并 未 显著 增加 ， 这 表明 写 操作 将 数据 写 到 了 系统 高 速 缓存 中 ， 我 们 并 没有 测量 将 数据 写 
到 磁盘 上 的 开销 。 


表 3-4 用 各 种 同步 机 制 在 Linux ext2 环 境 中 取得 的 计时 结果 


取 自 表 3-2 中 BUFFSIZE = 4 096 的 读 时 间 
正常 写 到 磁盘 文件 

设置 0_sYNC 后 写 到 磁盘 文件 

写 到 磁盘 后 接着 调用 fdatasync 

写 到 磁盘 后 接着 调用 fsync 

在 设置 0_sYNC 的 条 件 下 写 到 磁盘 ， 按 着 调用 fsync 


当 支 持 同步 写 时 ， 系 统 时 间 和 时 钟 时 间 应 当 会 显著 增加 。 从 第 3 行 可见 ， 同 步 写 所 用 的 时 
间 与 延迟 写 所 用 的 时 间 几 乎 相同 。 这 意味 着 Linux ext2 文 件 系统 并 未 真正 实现 0_SYNC 标 志 功 
能 。 第 6 行 的 时 间 值 支持 了 我 们 的 这 种 怀疑 ， 其 中 显示 ， 实 施 同步 写 ， 然 后 跟随 fsync 调 用 ， 
这 一 操作 序列 所 用 的 时 间 与 写 文件 〈 未 设置 同步 标志 ) ， 然 后 接着 执行 Etsync 调 用 这 一 序列 所 
用 的 时 间 (第 5 行 ) 几乎 相同 。 在 同步 写 一 个 文件 后 ， 我 们 期 望 fsync 调 用 不 会 产生 影响 。 
表 3-5 显 示 了 在 Mac OS X 10.3 上 运行 同样 的 测试 所 得 到 的 计时 结果 。 注 意 该 计时 结果 与 我 
们 的 期 望 相符 ， 同 步 写 较 延 迟 写 所 消耗 的 时 间 增 加 了 很 多 ， 而 且 在 同步 写 后 再 调用 函数 fsync 
并 不 会 产生 测量 上 的 显著 差别 。 还 要 引起 注意 的 是 ， 在 延迟 写 后 增加 一 个 Esync 函 数 调用 也 不 
产生 可 测量 的 差别 。 其 原因 很 可 能 是 ， 当 写 新 数据 到 某 个 文件 中 时 ， 操 作 系 统 将 以 前 写 的 数据 
冲洗 到 了 磁盘 上 ， 所 以 在 调用 销 数 fsync 时 几乎 就 没有 什么 工作 要 做 了 。 








m3-5 用 各 种 同步 机 制 在 Mac OS X 环 境 中 取得 的 计时 结果 


用 户 CPU ( 秒 ) | 系统 CPU ( 秒 ) | 时 钟 时 间 (£) 


5 3 /dev/null 

正常 写 到 磁盘 文件 

设置 Oo_FSYNC 后 写 到 磁盘 文件 

写 到 磁盘 后 接着 调用 fsync 

在 设置 0_FSYNC 的 条 件 下 写 到 磁盘 ， 接 着 调用 fsync 





比较 fsync 和 fdatasync 与 O_SYNC 标 志 ， fsync 和 fdatasync 在 我 们 需要 时 更 新 文件 
内 容 ，0_SYNC 标 志 则 在 我 们 每 次 写 至 文件 时 更 新 文件 内 容 。 口 

在 本 例 中 ， 我 们 看 到 了 fcnt1 的 必要 性 。 我 们 的 程序 在 一 个 描述 符 (标准 输出 ) 上 进行 
作 ， 但 是 根本 不 知道 由 shel 打 开 的 相应 文件 的 文件 名 。 因 为 这 是 shell 打 开 的 ， 于 是 不 能 在 打开 
时 ， 按 我 们 的 要 求 设置 0_sYNC 标 志 。fcnt1 则 人 允许 仅 知 道 打开 文件 描述 符 时 可 以 修改 其 性 质 。 
在 说 明 非 阻塞 管道 时 (15.2 节 ), 我 们 还 将 了 解 到 ,由 于 我 们 对 管道 所 具有 的 知识 只 是 其 描述 符 ， 
所 以 也 需要 使 用 fcnt1 的 功能 。 


3.15 ioct1 函 数 
ioct1 消 数 是 VO 操作 的 杂 物 箱 。 不 能 用 本 章 中 其 他 函数 表示 的 VO 操作 通常 都 能 用 ioct1l 
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表示 。 终 端 JO 是 ioct1 的 最 大 使 用 方面 (第 18 章 将 介绍 POSIX.1 已 经 用 一 些 新 函数 代替 ioct1 
进行 终端 VO 操作 )。 
#include <unistd.h> /* System V */ 


#include <sys/ioctl.h> /* BSD and Linux */ 
#include <stropts.h> /* XSI STREAMS */ 


int ioctl(int filedes, int request, ...); 





返回 值 : 若 出 错 则 返回 -1， 车 成 功 则 返回 其 他 值 


ioct1 函 数 只 是 Single UNIX Specification 标 准 的 一 个 扩展 ， 以 便 处 理 STREAMS 设 备 [Rago 1993], 
但 是 ，UNIX 系 统 实现 用 它 进 行 很 多 杂项 设备 操作 。 有 些 实现 甚至 将 它 扩 展 到 用 于 普通 文件 。 


我 们 所 示 的 原型 对 应 于 POSIX.1，FreeBSD 5.2.1 和 Mac OS X 10.3 将 第 二 个 参数 声明 为 
unsigned long。 因 为 第 二 个 参数 总 是 一 个 头 文件 中 的 defined 名 字 ， 所 以 这 种 细节 并 没有 
什么 影响 。 

对 于 ISO C 原 型 ， 它 用 省 略 号 表示 其 余 参 数 。 但 是 ， 通 常 只 有 另外 一 个 参数 ， 它 常常 是 指 
向 一 个 变量 或 结构 的 指针 。 

在 此 原型 中 ， 我 们 表示 的 只 Meloct Re FERD 通常 ， 还 要 求 另 外 的 设备 
专用 头 文件 。 例 如 ， 除 POSIX.1 所 说 明 的 基本 操作 之 外 ， 终 端 VO 的 ioct1 命 令 都 需要 头 文件 
«termios.h», 

每 个 设备 驱动 程序 都 可 以 定义 它 自 己 专 用 的 一 组 ioct1 命 令 。 系 统 则 为 不 同 种 类 的 设备 提 
供 通用 的 ioct1 命 令 。 表 3- 6 总 结 了 FreeBSD 所 支持 的 通用 ioct1 命 令 的 一 此 类别。 


表 3-6 通用 FreeBSD ioctl 操 作 


DIOxxx [rov S AMEINEELAS om h» 
RES FIOxxx <sys/filio.h> 


磁带 IO MTIOXXX «sys/mtio.h» 
BR TIO SIOxxx <sys/sockio.h> 


VO TIOxxx «sys/ttycom.h» 





磁带 操作 使 我 们 可 以 在 磁带 上 写 一 个 文件 结束 标志 、 反 绕 磁 带 、 越 过 指定 个 数 的 文件 或 记 
录 等 等 ， 用 本 章 中 的 其 他 函数 (read. write, lseek#) 都 难以 表示 这 些 操作 ， 所 以 ， 用 
ioct1 是 对 这 些 设备 进行 操作 的 最 容易 方法 。 


在 14.4 节 中 说 明 STREAMS 系 统 、18.12 节 中 获取 和 设置 终端 窗口 大 小 以 及 19.7 节 中 论 及 伪 
终端 的 高 级 功能 时 ， 都 将 使 用 ioct1 函 数 。 


3.16 /dev/fd 


较 新 的 系统 都 提供 名 为 /dev/fd 的 上 且 录 ， 其 目录 项 是 名 为 0、1、2 等 的 文件 。 打 开 文 件 
/dev/fd/n 等 效 二 复制 描述 符 n (假定 描述 符 n 是 打开 的 )。 


/dev/fd 这 种 特征 是 由 Tom Duff 开 发 的 ， 它 首先 出 现在 Research UNIX System 的 第 8 版 中 ， 本 书 说 
明 的 所 有 四 种 系统 部 支持 这 种 特征 。 它 不 是 POSIX.1 的 组 成 部 分 。 
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在 下 列 函数 调用 中 : 

fd = open("/dev/fd/0", mode); 
大 多 数 系统 忽略 它 所 指定 的 mode ， 而 另外 一 些 则 要 求 moae 必 须 是 所 涉及 的 文件 (在 这 里 则 是 
标准 输入 ) 原先 打开 时 所 使 用 mode 的 子 集 。 因 为 上 面 的 打开 等 效 于 : 


fd = dup(0); 


所 以 描述 符 0O 和 fa 共享 同一 文件 表 项 ( 见 图 3-3)。 例 如 ， 车 描述 符 0 先 前 被 打开 为 只 读 ， 那 么 我 
们 也 只 能 对 fd 进行 读 操 作 。 即 使 系统 忽略 打开 模式 ， 并 且 下 列 调用 成 功 ， 

fd = open("/dev/fd/0", O_RDWR); 
我 们 仍然 不 能 对 fdq 进 行 写 操作 。 

我 们 也 可 以 用 /aev/ fa 作为 路 径 名 参数 调用 creat， 这 与 调用 open 时 ， 用 CO_cREAT 作 为 
第 2 个 参数 作用 相同 。 例 如 ， 若 程序 调用 creat ， 并 且 路 径 名 参数 是 /aev/ fa/1 等 ， 那 么 该 程 
序 仍 能 工作 。 

某 些 系统 提供 路 径 名 /dev/stdin、/dev/stdout 和 /daev/stderr。 这 些 等 效 于 
/aev/fdq/0、/aev/fd/1 和 /dev/fd/2。 

/dev/fd 文 件 主要 由 shell 使 用 ， 它 允许 使 用 路 径 名 作为 调用 参数 的 程序 ， 能 用 处 理 其 他 路 
径 名 的 相同 方式 处 理 标 准 输 入 和 输出 。 例 如 ，cat(1) 程 序 对 其 命令 行 参数 采取 了 一 种 特殊 处 理 ， 
它 将 单独 的 一 个 字符 “-” 解 释 为 标准 输入 。 例 如 : 


filter file2 | cat filel - file3 | lpr 
首先 cat 读 file1， 按 着 读 其 标准 输入 (也 就 是 filter file2 命 令 的 输出 )， 然 后 读 file3， 
如 车 支持 /dev/£6， 则 可 以 删除 cat 对 “-” 的 特殊 处 理 ， 于 是 我 们 就 可 键入 下 列 命令 行 ; 


filter file2 | cat filel /dev/fd/0 file3 | lpr 


在 命令 行 中 用 “-” 作 为 一 个 参数 ， 特 指标 准 输入 或 标准 输出 ， 这 已 由 很 多 程序 采用 。 但 是 
这 会 带 来 一 些 问题 ， 例 如 车 用 “-” 指 定 第 一 个 文件 名 ， 那 么 它 看 来 就 像 指 定 了 命令 行 中 的 一 个 
选项 。/Gev/f6 则 提高 了 文件 名 参数 的 一 致 性 ， 也 更 加 清晰 。 


3.17 小 结 


本 章 说 明了 UNIX 系 统 提供 的 基本 VO 函数 。 因 为 read 和 write 都 在 内 核 执行 ， 所 以 称 这 
些 函 数 为 不 带 缓 冲 的 IO 函数 。 在 只 使 用 read 和 write 情况 下 ， 我 们 观察 了 不 同 的 IO 长 度 对 读 
文件 所 需 时 间 的 影响 。 我 们 也 观察 了 许多 将 写 人 的 数据 冲洗 到 磁盘 上 的 方法 ， 说 明了 它们 对 应 
用 程序 性 能 的 影响 。 

在 说 明 多 个 进程 对 同一 文件 进行 添 写 操 作 以 及 多 个 进程 创建 同一 文件 时 ， 本 章 介绍 了 原子 
操作 。 也 介绍 了 内 核 用 来 共享 打开 文件 信息 的 数据 结构 。 在 本 书 的 稍 后 部 分 还 将 涉及 这 些 数据 
结构 。 

我 们 还 介绍 了 ioct1l 和 fcnt1 函 数 。 第 14 章 还 将 使 用 这 两 个 函数 ， 将 ioct1l 用 于 STREAMS 
IO 系统 ， 将 fcnt1 用 于 记录 锁 。 


习题 
31 当 读 / 写 磁 盘 文件 时 ， 本 章 中 描述 的 函数 是 否 有 缓冲 机 制 ? 请 说 明 原因 。 
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编写 一 个 与 3.12 节 中 dup2 功 能 相同 的 函数 ， 要 求 不 调用 fcnt1 函 数 ， 并 且 要 有 正确 的 出 错 
处 理 。 
假设 一 个 进程 执行 下 面 的 3 个 函数 调用 : 
fdl = open(pathname, oflags); 
fd2 = dup(fdl); 
fd3 = open(pathname, oflags) ; 
画 出 类 似 于 图 3-3 的 结果 图 。 对 fcnt1 作 用 于 fd1l 来 说 ，F_SETFD 命 令 会 影响 哪 一 个 
文件 描述 符 ? F_SETFL 呢 ? 
在 许多 程序 中 都 包含 下 面 一 段 代 码 : 
dup2(fd, 0); 
dup2 (fd, 1); 
dup2(fd, 2); 
if (fd » 2) 
close(fd); 
为 了 说 明 iE 语 名 的 必要 性 ， 假 设 Eq 是 1， 画 出 每 次 调用 aup2 时 3 个 描述 符 项 及 相应 的 
文件 表 项 的 变化 情况 。 然 后 再 画 出 £6 为 3 的 情况 。 
在 Bourne shell, Bourne-again shell 和 Korn shell} , digit] > &digit2 表 示 要 将 描述 符 digitl 重 
定向 至 描述 符 digit2 的 同一 文件 。 请 说 明 下 面 两 条 命令 的 区 别 。 
./a.out > outfile 2>&1 
./a.out 2>&1 > outfile 
(提示 : shell 从 左 到 右 处 理 命令 行 。) 
如 果 使 用 添加 标志 打开 一 个 文件 以 便 读 、 写 ， 能 否 仍 用 1seek 在 任 一 位 置 开始 读 ? 能 否 用 
lseek 更 新 文件 中 任 一 部 分 的 数据 ? 请 编写 一 段 程序 以 验证 之 。 
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第 4 
文件 和 目录 


4.4 引言 


上 一 章 我 们 说 明了 执行 WO 操作 的 基本 函数 ， 其 中 的 讨论 是 围绕 普通 文件 WO 进行 的 一 一 打 
开 一 个 文件 ， 读 或 写 一 个 文件 。 本 章 将 描述 文件 系统 的 其 他 特征 和 文件 的 性 质 。 我 们 将 从 
stat 函 数 开 始 ， 逐 个 说 明 stat 结 构 的 每 一 个 成 员 以 了 解 文件 的 所 有 属性 。 在 此 过 程 中 ， 我 们 
将 说 明 修改 这 些 属性 的 各 个 函数 (更改 所 有 者 、 更 改 权限 等 )， 还 将 更 详细 地 查看 UNIX 文 件 系 
统 的 结构 以 及 符号 链接 。 本 章 最 后 介绍 了 对 目录 进行 操作 的 各 个 函数 ， 并 且 开 发 了 一 个 以 降序 
遍历 目录 层次 结构 的 函数 。 


4.2 stat、fstat 和 1Lstat 函 数 
本 章 讨论 的 中 心 是 三 个 stat 国 数 以 及 它们 所 返回 的 信息 。 


#include «sys/stat.h» 


int stat(const char *restrict pathname, struct stat *restrict buf); 


int fstat (int filedes, struct stat *buf); 
int lstat(const char *restrict pathname, struct stat *restrict buf); 


三 个 函数 的 返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 -1 


一 旦 给 出 parhname ，stat 国 数 就 返回 与 此 命名 文件 有 关 的 信息 结构 。fstat 国 数 获 取 已 
在 描述 符 filedes 上 打开 文件 的 有 关 信 息 。1lstat 函数 类 似 于 stat， 但 是 当 命 名 的 文件 是 一 个 符 
号 链接 时 ，1stat 返 回 该 符号 链接 的 有 关 信 息 ， 而 不 是 由 该 符号 链接 引用 文件 的 信息 。( 在 4.21 
节 中 ， 当 以 降序 遍历 目录 层次 结构 时 ， 需 要 用 到 1stat。4.16 节 将 更 详细 地 说 明 符 号 链接 。) 

第 二 个 参数 buf 是 指针 ， 它 指向 一 个 我 们 必须 提供 的 结构 。 这 些 函 数 填写 由 bw 指向 的 结构 。 
该 结构 的 实际 定义 可 能 随 实现 有 所 不 同 ， 但 其 基本 形式 是 ， 


struct stat { 





mode_t st_mode; /* file type & mode (permissions) */ 
ino_t st_ino; /* i-node number (serial number) */ 
dev_t st_dev; /* device number (file system) */ 
dev_t st_rdev; /* device number for special files */ 
nlink t st nlink; /* number of links */ 

uid t st uid; /* user ID of owner */ 

gid t st gid; /* group ID of owner */ 

off t st size; /* size in bytes, for regular files */ 
time t st atime;  /* time of last access */ 

time t st mtime; /* time of last modification */ 

time t st ctime; /* time of last file status change */ 
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blksize_t st_blksize; /* best I/O block size */ 
blkcnt t st blocks; /* number of disk blocks allocated */ 


POSIX. 1ARXKst_rdev, st blksize/est blocks f4, Single UNIX Specification XSI 扩展 则 
定义 了 这 些 字段 。 

注意 ， 该 结构 中 的 每 一 个 成 员 都 是 基本 系统 数据 类 型 ( 见 2.8 节 ) 。 我 们 将 说 明 此 结构 的 每 
个 成 员 以 了 解 文件 属性 。 

使 用 stat 国 数 最 多 的 可 能 是 1s -1 命令 ， 用 其 可 以 获得 有 关 一 个 文件 的 所 有 信息 。 


43 文件 类 型 


至 今 我 们 已 介绍 了 两 种 不 同 的 文件 类 型 一 一 普通 文件 和 目录 。UNIX 系 统 的 大 多 数 文件 是 
普通 文件 或 目录 ,但 是 也 有 另外 一 些 文件 类 型 。 文 件 类 型 包括 如 下 几 种 : 

(1) 普通 文件 (regular file)。 这 是 最 常用 的 文件 类 型 ， 这 种 文件 包含 了 某 种 形式 的 数据 。 
至 于 这 种 数据 是 文本 还 是 二 进 制 数据 对 于 UNIX 内 核 而 言 并 无 区 别 。 对 普通 文件 内 容 的 解释 由 
处 理 该 文件 的 应 用 程序 进行 。 

一 个 值得 注意 的 例外 是 二 进 制 可 执行 文件 。 为 了 执行 程序 ， 内 核 必 须 理解 其 格式 。 所 有 二 进 制 可 
执行 文件 都 遵循 一 圩 格式 ， 这 种 格式 使 声 核 能 够 确定 程序 文 认 和 数据 的 加 载 位 置 。 


(2) 目录 文件 (directory file)。 这 种 文件 包含 了 其 他 文件 的 名 字 以 及 指向 与 这 些 文件 有 关 信 
息 的 指针 。 对 一 个 目录 文件 具有 读 权限 的 任 一 进程 都 可 以 读 该 目录 的 内 容 ， 但 只 有 内 核 可 以 直 
接 写 目录 文件 。 进 程 必须 使 用 本 章 说 明 的 函数 才能 更 改 目 录 。 

(3) 块 特殊 文件 (block special file)。 这 种 文件 类 型 提供 对 设备 (例如 磁盘 ) 带 缓冲 的 访问 ， 
每 次 访问 以 固定 长 度 为 单位 进行 。 

(4) 字符 特殊 文件 (character special file)。 这 种 文件 类 型 提供 对 设备 不 带 缓冲 的 访问 ， 每 次 
访问 长 度 可 变 。 系 统 中 的 所 有 设备 要 么 是 字符 特殊 文件 ， 要 么 是 块 特殊 文件 。 

(5) FIFO。 这 种 类 型 文件 用 于 进程 间 通 信 ， 有 时 也 将 其 称 为 命名 管道 (named pipe), 15.5 
节 将 对 其 进行 了 说 明 。 

(6) 套 接 字 (socket)。 这 种 文件 类 型 用 于 进程 间 的 网 络 通信 。 套 接 字 也 可 用 于 在 一 台 宿 主 
机 上 进程 之 间 的 非 网 络 通信 。 第 16 章 将 用 套 接 字 进 行进 程 间 的 通信 。 

(7) 符号 链接 (symbolic link)。 这 种 文件 类 型 指向 另 一 个 文件 。4.16 节 将 更 多 地 述 及 符号 链接 。 

文件 类 型 信息 包含 在 stat 结 构 的 st_mode 成 员 中 。 可 以 用 表 4-1 中 的 宏 确 定 文件 类 型 。 这 
些 宏 的 参数 都 是 stat 结 构 中 的 st_mode 成 员 。 


表 4-1 <sys/stat.h> 中 的 文件 类 型 宏 


S ISREG() 普通 文件 
S_ISDIR() 且 录 文件 
S ISCHR() 字符 特殊 文件 


S 
S 
S 


ISFIFO() 管道 或 FIFO 
ISLNK() 符号 链接 
ISSOCK () ERF 





S_ISBLK Q 块 特殊 文件 
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POSIX.1 人 允许 实现 将 进程 间 通 信 (IPC) 对 象 〈( 例 如， 消息 队列 和 信和 号 量 等 ) 表示 为 文件 。 
表 4-2 中 的 宏 可 用 来 确定 IPC 对 象 的 类 型 。 这 些 宏 与 表 4-1 中 的 不 同 ， 它 们 的 参数 并 非 st_mode， 
而 是 指向 stat 结构 的 指针 。 


表 4-2 <sys/stat.h> 中 的 IPC 类 型 宏 


S_TYPEISMQ () 消息 队列 





S TYPEISSEM() 信和 号 量 
S. TYPEISSHM() 共享 存储 对 象 
消息 队列 、 信 号 量 以 及 共享 存储 对 象 等 在 第 15 章 中 讨论 。 但 是 ， 本 书 讨论 的 四 种 UNIX 系 


统 都 不 将 这 些 对 象 表示 为 文件 。 





程序 清单 4-1 中 的 程序 取 其 命令 行 参 数 ， 然 后 针对 每 一 个 命令 行 参 数 打 印 其 文件 类 型 。 
程序 清单 4-1 对 每 个 命令 行 参数 打印 文件 类 型 


#include "apue.h" 
int 
main(int argc, char *argv{]} 


{ 


int i; 
struct stat buf; 
char *ptr; 


for (i = 1; i < argc; i++) { 
printf("$s: ", argv[il):; 
if (lstat(argv[il], &buf) < 0) { 
err ret("lstat error"); 
continue; 


if (S ISREG(buf.st mode)) 
ptr - "regular"; 
else if (S ISDIR(buf.st mode)) 


ptr = "directory"; 
else if (S ISCHR(buf.st mode)) 
ptr = "character special"; 


else if (S ISBLK(buf.st mode)) 
ptr = "block special"; 

else if (S ISFIFO(buf.st mode)) 
ptr - "fifo"; 

else if (S ISLNK(buf.st mode)) 
ptr = "symbolic link"; 

else if (S ISSOCK(buf.st mode)) 
ptr = "socket"; 

else 
ptr - "** unknown mode **"; 

printf("%s\n", ptr); 

) 


exit(í0); 
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程序 清单 4-1 程 序 的 示例 输出 是 : 


$ ./a.out /etc/passwd /etc /dav/initctl /dev/log /dev/tty \ 
> /dev/scei/host0/bus0/target0/lun0/cd /dev/cdrom 
/etc/passwd: regular 

/etc: directory 

/dev/initctl: fifo 

/dev/log: socket 

/dev/tty: character special 
/dev/scsi/host0/bus0/target0/lun0/cd: block special 
/dev/cdrom: symbolic link 


(其 中 ， 在 第 一 个 命令 行 末 端 我 们 键入 了 一 个 反 斜 枉 ， 通 知 shel 要 在 下 一 行 继续 键入 命令 ， 然 
后 ，sheH 在 下 一 行 上 用 其 第 二 提示 符 > 提 示 我 们 。 ) 我 们 特地 使 用 了 1stat 国 数 而 不 是 stat 国 
数 以 便 检测 符号 链接 。 如 若 使 用 了 stat 畏 数 ， 则 不 会 观察 到 符号 链接 。 

为 了 在 Linux 系 统 上 编译 该 程序 ， 必 须 定义 _GNU_SOURCE ， 这 样 就 能 包括 $s_ISSOCK 宏 的 
定义 。 口 

早期 的 UNIX 系 统 版 本 并 不 提供 S_ISxxx 宏 ， 于 是 就 需要 将 st_mode 与 屏蔽 字 5_IFMT 进 
行 逻辑 “与 ”运算 ,然后 与 名 为 8_IFxxx 的 常量 相 比 较 。 大 多 数 系统 在 文件 <sys/stat.h> 
中 定义 了 此 屏 项 字 和 相关 的 常量 。 如 车 查 看 此 文件 ， 则 可 找到 S_ISDIR 宏 定义 为 : 


#define S_ISDIR(mode) (((mode) & S IFMT) == S_IFDIR) 


我 们 说 过 ， 普 通 文件 是 最 主要 的 文件 类 型 ， 但 是 观察 一 下 在 一 个 给 定 的 系统 中 各 种 文件 的 
比例 是 很 有 意思 的 。 表 4-3 显 示 了 在 一 个 用 作 单 用 户 工作 站 的 Linux 系 统 上 的 统计 值 和 百分比 。 
这 些 数据 是 由 4.21 节 中 的 程序 得 到 的 。 


R43 ”不 同类 型 文件 的 统计 值 和 百分比 


ED 


226 856 
23 017 
6 442 





4.4 设置 用 户 ID 和 设置 组 ID 
与 一 个 进程 相关 联 的 ID 有 6 个 或 更 多 ， 它 们 示 于 表 4-4 中 。 


表 4-4 与 每 个 进程 相关 联 的 用 户 ID 和 组 ID 
实际 用 户 ID 我 们 实际 上 是 谁 
实际 组 D 
有 效用 户 ID 用 于 文件 访问 权限 检查 
有 效 组 ID 


附加 组 ID 
保存 的 设置 用 户 ID 由 exec 国 数 保存 
保存 的 设置 组 ID 
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。 实 际 用 户 ID 和 实际 组 ID 标识 我 们 究竟 是 谁 。 这 两 个 字段 在 登录 时 取 自 口令 文件 中 的 登录 
项 。 通 常 ， 在 一 个 登录 会 话 间 这 些 值 并 不 改变 ， 但 是 超级 用 户 进程 有 方法 改变 它们 ，8.10 

节 将 说 明 这 些 方法 。 

。 有 效用 户 ID， 有 效 组 ID 以 及 附加 组 ID 决定 了 我 们 的 文件 访问 权限 ， 下 一 节 将 对 此 进行 说 

Bj (我 们 已 在 1.8 节 中 说 明了 附加 组 ID)。 

。 保 存 的 设置 用 户 ID 和 保存 的 设置 组 ID 在 执行 一 个 程序 时 包含 了 有 效用 户 ID 和 有 效 组 ID 的 

副本 ， 在 8.1 节 中 说 明 setuid 国 数 时 ， 将 说 明 这 两 个 保存 值 的 作用 。 


在 POSIX.1 2001 版 中 ， 需 要 这 些 保 存 的 ID。 在 早期 POSIX 版 本 中 ， 它 们 是 可 选 的 。 一 个 应 用 程序 
在 编译 时 可 测试 常量 _POSIX_SRAVED_ TDS， 或 在 运行 时 以 参数 _SC_SAVED_IDS 调 用 函数 sysconf， 以 
判断 此 实现 是 否 支持 这 种 特征。 


通常 ， 有 效用 户 ID 等 于 实际 用 户 ID， 有 效 组 ID 等 于 实际 组 ID。 

每 个 文件 都 有 一 个 所 有 者 和 组 所 有 者 ， 所 有 者 由 stat 结 构 中 的 st_ui6 成 员 表 示 ， 组 所 有 
者 则 由 st_gidG 成 员 表 示 。 

当 执 行 一 个 程序 文件 时 ， 进 程 的 有 效用 户 ID 通常 就 是 实际 用 户 ID ， 有 效 组 ID 通常 是 实际 组 
ID。 但 是 可 以 在 文件 模式 字 (st mode) 中 设置 一 个 特殊 标志 ， 其 含义 是 “ 当 执 行 此 文件 时 ， 
将 进程 的 有 效用 户 ID 设 置 为 文件 所 有 者 的 用 户 ID (st uid)". 与 此 相 类 似 ， 在 文件 模式 字 中 可 
以 设置 另 一 位 ， 它 使 得 将 执行 此 文件 的 进程 的 有 效 组 ID 设 置 为 文件 的 组 所 有 者 ID (st_gid)。 在 
文件 模式 字 中 的 这 两 位 被 称 为 设置 用 户 ID (set-user-ID) 位 和 设置 组 ID (set-group-ID) 位 。 

例如 ， 若 文件 所 有 者 是 超级 用 户 ， 而 且 设置 了 该 文件 的 设置 用 户 ID 位 ， 然 后 当 该 程序 由 一 
个 进程 执行 时 ， 则 该 进程 具有 超级 用 户 特权 。 不 管 执行 此 文件 的 进程 的 实际 用 户 ID 是 什么 ， 都 
进行 这 种 处 理 。 例 如 ，UNIX 程 序 passwa(1) 人 允许 任 一 用 户 改 变 其 口令 ， 该 程序 是 一 个 设置 用 户 
ID 程 序 。 因 为 该 程序 应 能 将 用 户 的 新 口令 写 入 口令 文件 (一 般 是 /etc/passwd 或 /etc/ 
shadow) 中 ， 而 只 有 超级 用 户 才 具 有 对 该 文件 的 写 权 限 ， 所 以 需要 使 用 设置 用 户 ID 特征 。 因 
为 运行 设置 用 户 ID 程序 的 进程 通常 得 到 额外 的 权限 ， 所 以 编写 这 种 程序 时 要 特别 谍 慎 。 第 8 章 
将 更 详细 地 讨论 这 种 类 型 的 程序 。 

再 返回 到 stat 国 数 ， 设 置 用 户 ID 位 及 设置 组 ID 位 都 包含 在 st_modGe 值 中 。 这 两 位 可 用 党 
4s rsuIDÁNS ISGIDJNX, 


4.5 文件 访问 权限 


st_mode 值 也 包含 了 针对 文件 的 访问 权限 位 。 当 提 及 文件 时 ， 指 的 是 前 面 所 提 到 的 任何 类 
型 的 文件 。 所 有 文件 类 型 (目录 文件 、 字 符 特别 文件 等 ) 都 有 访问 权限 (access permission)。 
很 多 人 认为 只 有 普通 文件 有 访问 权限 ， 这 是 一 种 误解 。 
每 个 文件 有 9 个 访问 权限 位 ， 可 将 它们 分 成 三 类 ， 见 表 4-5。 
在 表 4-5 开 头 三 行 中 ， 术 语 用 户 指 的 是 文件 所 有 者 (owner) 。chmodG(1) 命 令 用 于 修改 这 9 个 
权限 位 。 该 命令 允许 我 们 用 u 表 示 用 户 (所 有 者 )， 用 g 表 示 组 ， 用 o 表 示 其 他 。 有 些 书籍 把 这 三 
种 用 户 类 型 分 别称 为 所 有 者 、 组 和 世界 。 这 会 造成 混乱 ， 因 为 chmodG 命 令 用 o 表 示 其 他 ， 而 不 
是 所 有 者 。 我 们 将 使 用 术语 用 户 、 组 和 其 他 ， 以 便 与 chmoa 命 令 一 致 。 
表 4-5 中 的 三 类 访问 权限 ( 即 读 、 写 及 执行 ) 以 各 种 方式 由 不 同 的 函数 使 用 。 我 们 将 这 些 不 
同 的 使 用 方式 汇总 在 下 面 ， 当 说 明 相 关 函 数 时 ， 再 进一步 作 讨 论 。 
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表 4-5 9 个 访问 权限 位 ， 取 自 <eye/etat .h> 


_IRUSR 用 户 - 读 
_IWUSR 用 户 - 写 
_IXUSR 用 户 -执行 
_IRGRP 组 - 读 
_IWGRP 组 - 写 

| IXGRP 组 -执行 







nw un 


o uu 





S, IROTH 其 他 - 读 
S_IWOTH 其 他 - 写 
S_IXOTH 其 他 -执行 


* 第 一 个 规则 是 ， 我 们 用 名 字 打 开 任 一 类 型 的 文件 时 ， 对 该 名 字 中 包含 的 每 一 个 目录 ， 包 
括 它 可 能 隐 含 的 当前 工作 目录 都 应 具有 执行 权限 。 这 就 是 为 什么 对 于 目录 其 执行 权限 位 
常 被 称 为 搜索 位 的 原因 。 

例如 ， 为 了 打开 文件 /usr/include/stdio.h,， 需要 对 目录 /、 /usr 和 /usr/ 
include 具 有 执行 权限 。 然 后 ， 需 要 具有 对 该 文件 本 身 的 适当 权限 ， 这 取决 于 以 何 种 模 

式 打开 它 〈 只 读 、 读 - 写 等 ) 。 

如 果 当 前 目录 是 /usr/incluae， 那 么 为 了 打开 文件 stdio .h， 需 要 有 对 该 工作 目 
录 的 执行 权限 。 这 是 隐 含 当前 工作 目录 的 一 个 实例 。 打 开 staio.h 文 件 与 打开 . /stdio 
.h 作 用 相同 。 

注意 ， 对 于 目录 的 读 权限 和 执行 权限 的 意义 是 不 相同 的 。 读 权限 允许 我 们 读 目 录 ， 

获得 在 该 目录 中 所 有 文件 名 的 列表 。 当 一 个 目录 是 我 们 要 访问 文件 的 路 径 名 的 一 个 组 成 
部 分 时 ， 对 该 目录 的 执行 权限 使 我 们 可 通过 该 目录 (也 就 是 搜索 该 目录 ， 和 寻找 一 个 特定 
的 文件 名 ) 。 

引用 隐 含 且 录 的 另 一 个 例子 是 ， 如 果 PATH 环 境 变量 (8.10 节 将 对 其 进行 说 明 ) 指定 
了 一 个 我 们 不 具有 执行 权限 的 目录 ， 那 么 shell 决 不 会 在 该 且 录 下 找到 可 执行 文件 。 

* 对 于 一 个 文件 的 读 权 限 决 定 了 我 们 是 否 能 够 打开 该 文件 进行 读 操 作 。 这 与 open 函 数 的 
O_RDONLY 和 O_RDWR 标志 相关 。 

“对 于 一 个 文件 的 写 权 限 决定 了 我 们 是 否 能 够 打开 该 文件 进行 写 操 作 。 这 与 open 国 数 的 
O_WRONLY 和 O_RDWR 标志 相关 。 

* 为 了 在 open 函 数 中 对 一 个 文件 指定 C0_TRUNC 标 志 ， 必 须 对 该 文件 具有 写 权限 。 

“为 了 在 一 个 目录 中 创建 一 个 新 文件 ， 必 须 对 该 目录 具有 写 权限 和 执行 权限 。 

* 为 了 删除 一 个 现 有 的 文件 ， 必 须 对 包含 该 文件 的 目录 具有 写 权 限 和 执行 权限 。 对 该 文件 
本 身 则 不 需要 有 读 、 写 权限 。 

* 如 果 用 6 个 exec 函 数 ( 见 8.10 节 ) 中 的 任何 一 个 执行 某 个 文件 ， 都 必须 对 该 文件 具有 执行 
权限 。 该 文件 还 必须 是 一 个 普通 文件 。 

进程 每 次 打开 、 创 建 或 删除 一 个 文件 时 ， 内 核 就 进行 文件 访问 权限 测试 ， 而 这 种 测试 可 能 


涉及 文件 的 所 有 者 (st_uid 和 st_gia)、 进 程 的 有 效 ID (有 效用 户 ID 和 有 效 组 ID) 以 及 进程 
的 附加 组 ID (车 支持 的 话 )。. 两 个 所 有 者 ID 是 文件 的 性 质 ， 而 两 个 有 效 ID 和 附加 组 ID 则 是 进程 
的 性 质 。 内 核 进行 的 测试 是 ， 
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(1) 若 进 程 的 有 效用 户 ID 是 0 (超级 用 户 ) ， 则 人 允许 访问 。 这 给 予 了 超级 用 户 对 整个 文件 系 
统 进 行 处 理 的 最 充分 的 自由 。 

(2) 若 进程 的 有 效用 户 ID 等 于 文件 的 所 有 者 ID (也 就 是 该 进程 拥有 此 文件 )， 那 么 : 者 所 有 
者 适当 的 访问 权限 位 被 设置 ， 则 允许 访问 ， 否 则 拒绝 访问 。 适 当 的 访问 权限 位 指 的 是 ， 若 进程 
为 读 而 打开 该 文件 ， 则 用 户 读 位 应 为 1， 若 进程 为 写 而 打开 该 文件 ， 则 用 户 写 位 应 为 1， 若 进程 
将 执行 该 文件 ， 则 用 户 执行 位 应 为 1。 i 

(3) 车 进程 的 有 效 组 ID 或 进程 的 附加 组 ID 之 一 等 于 文件 的 组 ID， 那 么 : 若 组 适当 的 访问 权 
限 位 被 设置 ， 则 允许 访问 ， 否 则 拒绝 访问 。 

(4) 车 其 他 用 户 适当 的 访问 权限 位 被 设置 ， 则 允许 访问 ， 否 则 拒绝 访问 。 

按 顺序 执行 这 四 步 。 注 意 ， 如 若 进 程 拥 有 此 文件 (第 2 步 )， 则 按 用 户 访问 权限 批准 或 拒绝 
该 进程 对 文件 的 访问 一 一 不 查看 组 访问 权限 。 类 似 地 ， 若 进程 并 不 拥有 该 文件 ， 但 进程 属于 某 
个 适当 的 组 ， 则 按 组 访问 权限 批准 或 拒绝 该 进程 对 文件 的 访问 一 一 不 查看 其 他 用 户 的 访问 权限 。 [94] 


4.6 新 文件 和 目录 的 所 有 权 


在 第 3 章 中 ， 当 说 明 用 open 或 creat 创 建新 文件 时 ， 我 们 并 没有 说 明 赋 予 新 文件 的 用 户 ID 
和 组 ID 是 什么 。4.20 节 将 说 明 mkGir 消 数 ， 此 时 就 会 了 解 如 何 创 建 一 个 新 目录 。 关 于 新 目录 的 
所 有 权 规 则 与 本 节 将 说 明 的 新 文件 所 有 权 规 则 相同 。 

新 文件 的 用 户 ID 设 置 为 进程 的 有 效用 户 ID。 关 于 组 ID，POSIX.1 人 允许 实现 选择 下 列 之 一 作 
为 新 文件 的 组 ID。 

(1) 新 文件 的 组 ID 可 以 是 进程 的 有 效 组 ID。 

(2) 新 文件 的 组 ID 可 以 是 它 所 在 目录 的 组 ID。 


FreeBSD 5.2.1 和 Mac OS X 10.3 总 是 使 用 目录 的 组 ID 作为 新 文件 的 组 iDp。 

Linux ext2 和 ext3 文 件 系统 允许 基于 文件 系统 在 POSIX.1 所 允许 的 两 种 选项 中 选择 一 种 ， 为 此 在 
mount(1) 命 令 中 使 用 了 一 个 特殊 标志 。 对 Linux 2.4.22 (使 用 适当 的 mount 选 项 ) 和 Solaris 9， 新 文件 的 
组 ID 取决 于 筷 所 在 目录 的 设置 组 ID 位 是 否 设置 。 如 果 该 目录 的 这 一 位 已 经 设置 ， 则 将 新 文件 的 组 ID 设 
置 为 目录 的 组 ID; 否则 将 新 文件 的 组 ID 设置 为 进程 的 有 效 组 ID。 








使 用 POSIX.1 所 人 允许 的 第 二 个 选项 〈 继 承 目 录 的 组 ID) 使 得 在 某 个 目录 下 创建 的 文件 和 目 
录 都 具有 该 目录 的 组 ID 。 于 是 文件 和 目录 的 组 所 有 权 从 该 点 向 下 传递 。 例 如 ， 在 Linux 的 
/var/spool/mail 目 录 中 就 使 用 这 种 方法 。 


正如 前 面 提 到 的 ， 这 种 设置 组 所 有 权 的 方法 对 FreeBSD 5.2.1 和 Mac OS X 10.3 是 系统 默认 的 ， 对 
Linux 和 Solaris 则 是 可 选 的 。 在 Linux 2.4.22 和 Solaris 9 之 下 ， 必须 使 设置 组 ID 位 起 作用 。 更 进一步 、 为 
使 这 种 方法 能 够 正常 工作 ，mkdir 汤 数 要 自动 地 和 传递 一 个 目录 的 设置 组 ID 位 (4.20 节 将 说 明 mkdir 就 是 
这 样 做 的 )。 


4.7 accessi Zi 


WAR, Mope R TAAR, ARDEA SUH PTDARUR CR ID A fA, 
行 其 访问 权限 测试 。 有 时 ， 进 程 也 希望 按 其 实际 用 户 ID 和 实际 组 ID 来 测试 其 访问 能 力 。 例 如 当 
一 个 进程 使 用 设置 用 户 ID 或 设置 组 ID 特征 作为 另 一 个 用 户 (RA) 运行 时 ， 就 可 能 会 有 这 种 需 
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要 。 即 使 一 个 进程 可 能 已 经 因 设置 用 户 ID 以 超级 用 户 权限 运行 ， 它 仍 可 能 想 验 证 其 实际 用 户 能 
否 访问 一 个 给 定 的 文件 。access 函 数 是 按 实 际 用 户 ID 和 实际 组 卫 进 行 访 问 权 限 测试 的 。( 该 测 
试 也 分 成 四 步 ， 这 与 4.5 节 中 所 述 的 一 样 ， 但 将 有 效 改 为 实际 。) 


#include <unistd.h> 


int access(const char *pathname, int mode); 


返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 -1 





其 中 ，mode 是 表 4-6 中 所 列 常量 的 按 位 或 。 
表 4-6 access 函 数 的 mode 常 量 ， 取 自 <unista.h> 










测试 读 权限 
测试 写 权限 
测试 执行 权限 

测试 文件 是 否 存 在 







程序 清单 4-2 显 示 了 access 函 数 的 使 用 方法 。 
程序 清单 4-2 ”access 函数 实例 


#include "apue.h" 

#include <fcntl.h> 

int 

main(int argc, char *argv[]) 


if (argc != 2) 

err quit("usage: a.out «pathname»"); 
if (access(argv[1], R OK) « 0) 

err ret("access error for $s", argv[1]); 
else 

printf ("read access OK\n"); 
if (open(argv[1], O RDONLY) < 0) 

err ret("open error for $s", argv[1]); 
else 

printf ("open for reading OK\n"); 
exit(0); 

) 
eee LLL 


下 面 是 该 程序 的 示例 会 话 ; 


$ 18 -1 a.out 

-rwxrwxr-x 1 sar 15945 Nov 30 12:10 a.out 

$ ./a.out a.out 

read access OK 

open for reading OK 

$ 18 -1 /etc/shadow 

-Y-------- 1 root 1315 Jul 17 2002 /etc/shadow 
$ ./a.out /etc/shadow 

access error for /etc/shadow: Permission denied 
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open error for /etc/shadow: Permission denied 


$ su 成 为 超级 用 户 
Password: 输入 超级 用 户口 令 

# chown root a.out 将 文件 用 户 ID 改 为 root 
# chmod u+s a.out 并 打开 设置 用 户 ID 位 
# ls -1 a.out 检查 所 有 者 和 SUID 位 
-rwsrwxr-x 1 root 15945 Nov 30 12:10 a.out 
# exit 回复 为 正常 用 户 


$ ./a.out /etc/shadow 
access error for /etc/shadow: Permission denied 
open for reading OK 


EAB, EHI PIDERFESTDASRE ci FAP EIR TE CE, Topen HARET 
开 该 文件 。 口 


在 上 例 及 第 8 章 中 ， 我 们 有 时 要 成 为 超级 用 户 ， 以 便 演 示 某 些 功能 是 如 何 工作 的 。 如 果 你 使 用 多 用 
户 系 统 ， 但 无 超级 用 户 权限 ， 那 么 你 就 不 能 完整 地 重复 这 些 实例 。 


4.8 umaskggZi 


至 此 我 们 已 说 明了 与 每 个 文件 相关 联 的 9 个 访问 权限 位 ， 在 此 基础 上 我 们 可 以 说 明 与 每 个 
进程 相关 联 的 文件 模式 创建 屏蔽 字 。 

umask 国 数 为 进程 设置 文件 模式 创建 屏蔽 字 ， 并 返回 以 前 的 值 。( 这 是 少数 几 个 没有 出 错 
返回 函数 中 的 -一 个 。) 





一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 


#include <sys/stat.h> 


mode t umask(mode t cmask) ; 


返回 值 : 以 前 的 文件 模式 创建 屏蔽 字 





其 中 ， 参 数 cmasK 是 由 表 4-5 中 列 出 的 9 个 常量 (S_IRUSR、S_IWUSR 等 ) 中 的 若干 个 按 位 
“或 ”构成 的 。 

在 进程 创建 一 个 新 文件 或 新 目录 时 ， 就 一 定 会 使 用 文件 模式 创建 屏蔽 字 (回忆 3.3 节 和 3.4 
节 ， 在 那里 我 们 说 明了 open 和 creat 函 数 。 这 两 个 函数 都 有 一 个 参数 mode， 它 指定 了 新 文件 
的 访问 权限 位 ) 。 我 们 将 在 4.20 节 说 明 如 何 创建 一 个 新 且 录 。 对 于 任何 在 文件 模式 创建 屏蔽 字 中 
为 上 [的 位 ， 在 文件 mode 中 的 相应 位 则 一 定 被 关闭 。 


实 例 


程序 清单 4-3 中 的 程序 创建 了 两 个 文件 ， 创 建 第 一 个 时 ，umask 值 为 0， 创 建 第 二 个 时 ， 
umask 值 禁止 所 有 组 和 其 他 用 户 的 访问 权限 。 


程序 清单 4-3 ”umask 和 函数 实例 





#include "apue.h" 
#include «fcntl.h» 


#define RWRWRW (S IRUSR|S IWUSR|S IRGRP|S IWGRP|S IROTH|S IWOTH) 
int 
main(void) 
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umask (0) ; 
if (creat ("foo", RWRWRW) < 0) 
err_sys("creat error for foo"); 
umask (S_IRGRP | S IWGRP | S IROTH | S IWOTH); 
if (creat("bar", RWRWRW) « 0) 
err Sys("creat error for bar"); 
exit(0); 


) 
车 运行 此 程序 可 得 如 下 结果 ， 从 中 可 见 访问 权限 是 如 何 设置 的 。 


$ umask 先 打 印 当 前 文件 模式 创建 屏蔽 字 
002 

$ ./a.out 

$ 1s -1 foo bar 

-TYW------- 1 sar 0 Dec 7 21:20 bar 
-rw-rw-rw- 1 sar 0 Dec 7 21:20 foo 

$ umask WE EK 8 Rit BE SERE Be 





002 


UNIX 系 统 的 大 多 数 用 户 从 不 处 理 他们 的 umask 值 。 通 常 在 登录 时 ， 由 shell 的 启动 文件 设 
置 一 次 ， 然 后 从 不 改变 。 尽 管 如 此 ,. 当 编 写 创建 新 文件 的 程序 时 ， 如 果 我 们 想 确保 指定 的 访问 
权限 位 已 经 激活 ， 那 么 必须 在 进程 运行 时 修改 umask 值 。 例 如 ， 如 果 我 们 想 确 保 任 何 用 户 都 能 
读 文 件 ， 则 应 将 umask 设 置 为 0。 否 则 ， 当 我 们 的 进程 运行 时 ， 有 效 的 umask 值 可 能 关闭 该 权 
B. 

在 前 面 的 示例 中 ， 我 们 用 shel 的 umask 命 令 在 运行 程序 的 前 、 后 打印 文件 模式 创建 屏蔽 字 。 
从 中 可 见 ， 更 改进 程 的 文件 模式 创建 屏蔽 字 并 不 影响 其 父 进程 〈 常 常 是 shel) 的 屏蔽 字 。 所 有 
shel 都 有 内 置 umask 命 令 ， 我 们 可 以 用 该 命令 设置 或 打印 当前 文件 模式 创建 屏蔽 字 。 

用 户 可 以 设置 umask 值 以 控制 他 们 所 创建 文件 的 默认 权限 。 该 值 表示 成 八进制 数 ， 一 位 代 
表 一 种 要 屏蔽 的 权限 ， 这 示 于 表 4-7 中 。 设 置 了 相应 位 后 ， 它 所 对 应 的 权限 就 会 被 拒绝 。 常 用 的 
几 种 umask 值 是 002、022 和 027，002 阻 止 其 他 用 户 写 你 的 文件 ，022 阻 止 同 组 成 员 和 其 他 用 户 
写 你 的 文件 ，027 阻 止 同 组 成 员 写 你 的 文件 以 及 其 他 用 户 读 、 写 或 执行 你 的 文件 。 











表 4-7 umask 文 件 访问 权限 位 





Single UNIX Specification 要 求 shell 支 持 符 号 形式 的 umask 命 令 。 与 八进制 格式 不 同 ， 符 号 
格式 指定 许可 的 权限 〈 即 在 文件 创建 屏 藏 字 中 为 0 的 位 ) 而 非 拒绝 的 权限 ( 即 在 文件 创建 屏蔽 
字 中 为 1 的 位 )。 下 面 比较 了 两 种 格式 的 命令 。 
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$ umask 先 打印 当前 文件 模式 创建 屏蔽 字 
002 

$ umask -S 打印 符号 形式 
UzIrWX,GgzrwX,O-rX 

$ umask 027 更 改 文件 模式 创建 屏蔽 字 

$ umask -S 打印 符号 形式 


U-rwX,gsrx,o- 


4.9 chmodj4üfchmodt Zi 
这 两 个 函数 使 我 们 可 以 更 改 现 有 文件 的 访问 权限 。 


#include <sys/stat.h> 


int chmod(const char *pathname, mode_t mode) ; 


int fchmod(int filedes, mode t mode); 





两 个 函数 返回 值 : 若 成 功 则 返回 0， 若 出 错 则 返回 -1! 


chmod 函 数 在 指定 的 文件 上 进行 操作 ， 而 fchmogd 函 数 则 对 已 打开 的 文件 进行 操作 。 

为 了 改变 一 个 文件 的 权限 位 ， 进 程 的 有 效用 户 ID 必须 等 于 文件 的 所 有 者 ID ， 或 者 该 进程 必 
须 具 有 超级 用 户 权 限 。 

参数 mode 是 表 4-8 中 所 示 常 量 的 某 种 按 位 或 运算 构成 的 。 


表 4-8 chmod 函 数 的 mode 常 量 ， 取 自 <syse/stat.h> 


S_ISUID 执行 时 设置 用 户 ID 
S_ISGID 执行 时 设置 组 ID 
S_ISVTX 保存 正文 Gf) 
S_IRWXU AP (所 有 者 ) 读 、 写 和 执行 
S_IRUSR 用 户 (所 有 者 ) iE 
S_IWUSR 用 户 ( 所 有 者 ) 写 
S IXUSR 用 户 (所 有 者 ) 执行 
S_IRWXG 组 读 、 写 和 执行 
S_IRGRP 组 读 
S_IWGRP 组 写 
S_IXGRP 组 执行 
S_IRWXO 其 他 读 、 写 和 执行 
S_IROTH 其 他 读 
S_IWOTH Rs 


S, IXOTH 其 他 执行 


注意 ， 在 表 4-8 中 ， 有 9 项 是 取 自 表 4-5 中 的 9 个 文件 访问 权限 位 。 我 们 另外 加 了 6 项 ， 它 们 是 
两 个 设置 ID 常量 (S_ISUID 和 S_ISGID)、 保 存 正文 常量 (S ISVTX), ， 以 及 三 个 组 合 常量 
(S_IRWXU、S_IRWXG 和 S_IRWXO)。 





保存 -正文 位 (S ISVTX) 不 是 POSIX.1 的 一 部 分 。 在 Single UNIX Specification 中 ， 它 被 定义 在 
XSI 扩 展 中 。 在 下 一 节 说 明 其 目的 。 
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x i 


为 了 演示 umask 函 数 ， 我 们 在 前 面 运行 了 程序 清单 4-3 中 的 程序 ， 先 让 我 们 回忆 文件 foo 和 
bar 当 时 的 最 终 状 态 : 


$ ls -1 foo bar 
-rW------- 1 sar 0 Dec 7 21:20 bar 
-rw-rw-rw- 1 sar 0 Dec 7 21:20 foo 


程序 清单 4-4 中 的 程序 修改 了 这 两 个 文件 的 模式 。 
程序 清单 4-4 chmod 函 数 实例 


#include "apue.h" 
int 
main (void) 
struct stat Btatbuf; 
/* turn on set-group-ID and turn off group-execute */ 


if (stat("foo", &statbuf) « 0) 

err Sys("stat error for foo"); 

(chmod("foo", (statbuf.st mode & ^S IXGRP) | S ISGID) « 0) 
err_sys ("chmod error for foo"); 


rh 


i 


/* set absolute mode to "rw-r--r--" */ 


(chmod("bar", S IRUSR | S IWUSR | S IRGRP | S IROTH) « 0) 
err_sys("chmod error for bar"); 


m 


i 


exit (0); 


} 
在 运行 程序 清单 44 中 的 程序 后 ， 这 两 个 文件 的 最 终 状 态 是 : 


$ ls -1 foo bar 
-rw-r--r-- 1 Bar 0 Dec 7 21:20 bar 
-rw-rwSrw- 1 sar 0 Dec 7 21:20 foo 


在 本 例 中 ， 不 管 文件 paz 的 当前 权限 位 如 何 ， 我 们 都 将 其 权限 设置 为 一 绝对 值 。 对 于 文件 fco， 
我 们 相对 于 其 当前 状态 设置 权限 。 为 此 ， 先 调用 stat 获 得 其 当前 权限 ， 然 后 修改 它 。 我 们 已 
显 式 地 打开 了 设置 组 ID 位 、 关 闭 了 组 执行 位 。 注 意 ，1s 命 令 将 组 执行 权限 表示 为 S， 它 表示 设 
置 组 也 位 已 设置 ， 同 时 ， 组 执行 位 则 未 设置 。 


在 Solaris 上 ，1s 命 令 显 示 1 而 非 5， 这 表示 对 该 文件 可 以 启用 强制 性 文件 或 记录 锁 。 这 只 能 用 于 普 
通 文件 ，14.3 节 更 详细 地 讨论 这 一 点 。 


最 后 也 要 注意 到 ， 在 运行 程序 请 单 4-4 中 的 程序 后 ，1s 命 令 列 出 的 时 间 和 日 期 并 设 有 改变 。 
在 4.18 节 中 ， 我 们 会 了 解 到 chmod 函 数 更 新 的 只 是 i 节点 最 近 一 次 被 更 改 的 时 间 。 按 系统 默认 方 
Ñ, 1s -1 列 出 的 是 最 后 修改 文件 内 容 的 时 间 。 国 


chmod 函 数 在 下 列 条 件 下 自动 清除 两 个 权限 位 : 

。Solaris 等 系统 对 用 于 普通 文件 的 粘 住 位 赋予 了 特殊 含义 ， 在 这 些 系统 上 如 果 我 们 试图 设 
置 普通 文件 的 粘 住 位 (S_ISVTX)， 而 且 又 没有 超级 用 户 特 权 ， 那 么 mode 中 的 粘 住 位 将 
自动 被 关闭 (我 们 将 在 下 一 节 说 明 粘 住 位 )。 这 意味 着 只 有 超级 用 户 才 能 设置 普通 文件 的 


bbs.theithome.com 


410 4 4 位 83 


粘 住 位 。 这 样 做 的 理由 是 防止 不 怀 好 意 的 用 户 设置 粘 住 位 ， 并 由 此 降低 系统 性 能 。 


在 FreeBSD 5.2.1, Mac OS X 10.3 和 Solaris 9 上 ， 只 有 超级 用 户 才 能 对 普通 文件 设置 粘 住 位 。 
Linux 2.4.22 对 设置 粘 住 位 并 无 此 种 限制 ， 其 原因 是 ， 粘 住 位 对 Linux 上 的 普通 文件 并 无 意义 。 虽 然 粘 住 
位 对 FreeBSD 和 Mac OS XX 的 普通 文件 也 无 圳 义 ， 但 是 这 两 个 系统 阻止 除 超 级 用 户 以 外 的 任何 用 户 对 兽 
通 文件 设置 该 位 。 


“新 创建 文件 的 组 ID 可 能 不 是 调用 进程 所 属 的 组 。 回 忆 一 下 4.6 节 ， 新 文件 的 组 ID 可 能 是 父 
目录 的 组 ID。 特 别 地 ， 如 果 新 文件 的 组 ID 不 等 于 进程 的 有 效 组 ID 或 者 进程 附加 组 ID 中 的 
一 个 ， 以 及 进程 没有 超级 用 户 特权 ， 那 么 设置 组 ID 位 将 自动 被 关闭 。 这 就 防止 了 用 户 创 
建 一 个 设置 组 卫 文 件 ， 而 该 文件 是 由 并 非 该 用 户 所 属 的 组 拥有 的 。 


FreeBSD 5.2.1, Linux 2.4.22, Mac OS X 10.3 和 Solaris 9 增加 了 另 一 个 安全 性 特征 以 试图 阻止 错误 
使 用 某 些 保护 位 。 如 果 没 有 超级 用 户 特权 的 进程 写 一 个 文件 ， 则 设置 用 户 ID 位 和 设置 组 ID 位 将 自动 被 
清除 。 如 果 不 怀 好 总 的 用 户 找到 一 个 他 们 可 以 写 的 设置 组 ID 和 设置 用 户 ID 文件 ， 即 使 可 以 修改 此 文件 ， 
但 他 们 也 去 失 了 对 该 文件 的 特殊 特权 。 


4.10 粘 住 位 


S_ISVTX 位 有 一 段 有 趣 的 历史 。 在 UNIX 尚 未 使 用 分 页 技术 的 早期 版 本 中 ，S_ISVTX 位 被 
称 为 粘 住 位 (sticky bit)。 如 果 一 个 可 执行 程序 文件 的 这 一 位 被 设置 了 ， 那 么 在 该 程序 第 一 次 被 
执行 并 结束 时 ， 其 程序 正文 部 分 的 一 个 副本 仍 被 保存 在 交换 区 。( 程 序 的 正文 部 分 是 机 器 指令 部 
分 。) 这 使 得 下 次 执行 该 程序 时 能 较 快 地 将 其 装 入 内 存 区 。 其 原因 是 : 交换 区 占用 连续 磁盘 空间 ， 
可 将 它 视 为 连续 文件 ， 而 且 一 个 程序 的 正文 部 分 在 交换 区 中 也 是 连续 存放 的 ， 而 在 一 般 的 UNIX 
文件 系统 中 ， 文 件 的 各 数据 块 很 可 能 是 随机 存放 的 。 对 于 常用 的 应 用 程序 ， 例 如 文本 编辑 器 和 
C 编 译 器 ， 我 们 常常 设置 它们 所 在 文件 的 粘 住 位 。 自 然 ， 对 于 在 交换 区 中 可 以 同时 存放 的 设置 
了 粘 住 位 的 文件 数 是 有 一 定 限 制 的 ， 以 免 过 多 占用 交换 区 空间 ， 但 无 论 如 何 这 是 一 个 有 用 的 技 
术 。 因 为 在 系统 再 次 自 举 前 ， 文 件 的 正文 部 分 总 是 在 交换 区 中 ， 所 以 使 用 了 名 字 “ 粘 住 "。 后 来 
的 UNIX 版 本 称 它 为 保存 正文 位 (saved-text bit)， 因 此 也 就 有 了 常量 Ss_ISVTX。 现 今 较 新 的 
UNIX 系 统 大 多 数 都 配置 有 虚拟 存储 系统 以 及 快速 文件 系统 ， 所 以 不 再 需要 使 用 这 种 技术 。 

现今 的 系统 扩展 了 粘 住 位 的 使 用 范围 ，Single UNIX Specification 人 允许 针对 目录 设置 粘 住 位 。 
如 果 对 一 个 目录 设置 了 粘 住 位 ， 则 只 有 对 该 目录 具有 写 权 限 的 用 户 在 满足 下 列 条 件 之 一 的 情况 
下 ， 才 能 删除 或 更 名 该 目录 下 的 文件 : 

。 拥 有 此 文件 。 

“拥有 此 目录 。 

。 是 超级 用 户 。 

目录 /tmp 和 /var/spool/uucppublic 是 设置 粘 住 位 的 典型 候选 者 一 一 任何 用 户 都 可 在 
这 两 个 日 录 中 创建 文件 。 任 一 用 户 (用 户 、 组 和 其 他 ) 对 这 两 个 目录 的 权限 通常 都 是 读 、 写 和 
执行 。 但 是 用 户 不 应 能 删除 或 更 名 属于 其 他 人 的 文件 ， 为 此 在 这 两 个 目录 的 文件 模式 中 都 设置 
了 粘 住 位 。 

POSIX.1 没 有 定义 保存 -正文 位 ，Single UNIX Specification} ¢ x 3 AXSI RB, FreeBSD 
5.2.1, Linux 2.4.22, Mac OS X 10.3 和 Solaris 9 则 支持 运 种 特征 。 


bbs.theithome.com 


84 第 4 章 文件 和 目录 


在 Solaris 9 中 ， 如 果 对 普通 文件 设置 了 粘 住 位 ， 那 么 它 就 具有 特殊 含义 。 在 这 种 情况 下 ， 如 若 执 
行 位 都 没有 设置 ， 那 么 操作 系统 就 不 会 高 速 绽 友 文件 内 容 。 
4.11 chown、fchown 和 1chown 函 数 
下 面 几 个 chown 销 数 可 用 于 更 改 文件 的 用 户 ID 和 组 ID。 


#include <unistd.h> 


int chown(const char *pathname, uid t owner, gid_t group); 


int fchown(int filedes, uid_t owner, gid_t group); 


int lchown(const char *pathname, uid t owner, gid t group); 


三 个 函数 的 返回 值 : 若 成 功 则 返回 0， 若 出 错 则 返回 -1 





除了 所 引用 的 文件 是 符号 链接 以 外 ， 这 三 个 国 数 的 操作 相似 。 在 符号 链接 的 情况 下 ， 
lchown 更 改 符号 链接 本 身 的 所 有 者 ， 而 不 是 该 符号 链接 所 指向 的 文件 。 


Single UNIX Specification 在 其 POSIX.1 功 能 的 扩展 部 分 XSI 中 定义 了 lchown 函 数 。 因 此 预期 所 有 
的 UNIX 实 现 都 会 提供 此 函数 。 


如 若 两 个 参数 owner 或 group 中 的 任意 一 个 是 -1， 则 对 应 的 ID 不 变 。 

基于 BSD 的 系统 一 直 规定 只 有 超级 用 户 才能 更 改 一 个 文件 的 所 有 者 。 这 样 做 的 原因 是 防止 
用 户 改变 其 文件 的 所 有 者 从 而 摆脱 磁盘 空间 限额 对 他 们 的 限制 。 系 统 V 则 人 允许 任 一 用 户 更 改 他 
们 所 拥有 的 文件 的 所 有 者 。 


按照 _POSTX_CHOWN_RESTRICTED 的 值 ，POSIX.1 在 过 两 种 形式 的 操作 中 选用 一 种 。 
对 于 Solaris 9， 此 功能 是 个 配置 选项 ， 其 默认 值 是 施加 限制 。 而 FreeBSD 52.1, Linux 2.4.22 和 
Mac OS X 10.3 则 总 对 chown 施 加 限制 。 


回忆 2.6 节 ，_POSIX_CHOWN_RESTRICTED 常 量 可 选 地 定义 在 头 文件 <unistd.h> 中 , if 
且 总 是 可 以 用 pathconf 或 fpathconf 销 数 查 询 。 此 选项 还 与 所 引用 的 文件 有 关 一 一 可 在 每 个 
文件 系统 基础 上 ， 使 该 选项 起 作用 或 不 起 作用 。 在 下 文中 ， 如 提 及 “ 若 _POSIX_CHOWN_ 
RESTRICTED 起 作用 ”， 则 表示 这 适用 于 我 们 正在 谈 及 的 文件 ， 而 不 管 该 实际 常量 是 否 在 头 文 
件 中 定义 。 
车 _POSIX_CHOWN_RESTRICTED 对 指定 的 文件 起 作用 ， 则 
() 只 有 超级 用 户 进程 能 更 改 该 文件 的 用 户 ID。 
(2) 若 满足 下 列 条 件 ， 一 个 非 超级 用 户 进程 就 可 以 更 改 该 文件 的 组 ID : 
(a) 进程 拥有 此 文件 〈 其 有 效用 户 ID 等 于 该 文件 的 用 户 ID )。 
(b) 参数 owner 等 于 一 1 或 文件 的 用 户 ID， 并 且 参 数 group 等 于 进程 的 有 效 组 ID 或 进程 的 附 
加 组 ID 之 一 。 
这 意味 着 ， 当 _POSIX_CHOWN_RESTRICTED 起 作用 时 ， 不 能 更 改 其 他 用 户 文件 的 用 户 ID。 
你 可 以 更 改 你 所 拥有 的 文件 的 组 ID， 但 只 能 改 到 你 所 属 的 组 。 
如 有 果 这 些 函 数 由 非 超 级 用 户 进程 调用 ， 则 在 成 功 返 回 时 ， 该 文件 的 设置 用 户 ID 位 和 设置 组 
ID 位 都 会 被 清除 。 
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4.12 文件 长 度 


stat 结 构成 员 st_size 表 示 以 字 节 为 单位 的 文件 长 度 。 此 字段 只 对 普通 文件 、 目 录 文 件 
和 符号 链接 有 意义 。 


Solaris 对 管道 也 定义 了 文件 长 度 ， 它 表示 可 从 该 管道 中 读 到 的 字 节 数 ， 我 们 将 在 15.2 节 中 讨论 管道 。 


对 于 普通 文件 ， 其 文件 长 度 可 以 是 0， 在 读 这 种 文件 时 ， 将 得 到 文件 结束 (end-of-file) 指示 。 

对 于 目录 ， 文 件 长 度 通常 是 一 个 数 ( 例 如 16 或 512) 的 倍数 ， 我 们 将 在 4.21 节 中 说 明 读 目 录 
操作 。 

对 于 符号 链接 ， 文 件 长 度 是 文件 名 中 的 实际 字 节 数 。 例 如 ， 


lrwxrwxrwx 1 root 7 Sep 25 07:14 lib -» usr/lib 


其 中 ,文件 长 度 7 就 是 路 径 名 usr/1ib 的 长 度 ( 注 意 ， 因 为 符号 链接 文件 长 度 总 是 由 st_size 
指示 ， 所 以 它 并 不 包含 通常 C 语 言 用 作 名 字 结 尾 的 null 字 符 )。 

现今 ， 大 多 数 UNIX 系 统 提供 字段 st_blksize 和 st_blocks。 其 中 ， 第 一 个 是 对 文件 IO 
较 合 适 的 块 长 度 ， 第 二 个 是 所 分 配 的 实际 512 字 节 块 数量 。 回 忆 3.9 节 ， 其 中 提 到 了 当 我 们 将 
st_blksize 用 于 读 操 作 时 ， 读 一 个 文件 所 需 的 时 间 量 最 少 。 为 了 效率 的 缘故 ， 标 准 IMO 库 
(我 们 将 在 第 5 章 中 说 明 ) 也 试图 一 次 读 、 写 st_blksize 个 字 节 。 

应 当 了 解 的 是 ， 不 同 的 UNIX 版 本 其 st_blocks 所 用 的 单位 可 能 不 是 512 字 节 的 块 。 使 用 此 值 并 不 
是 可 移植 的 。 

文件 中 的 空洞 

在 3.6 节 中 ， 我 们 提 及 普通 文件 可 以 包含 空洞 。 在 程序 清单 3-2 中 例证 了 这 一 点 。 空 洞 是 由 
所 设置 的 偏 移 量 超过 文件 尾 端 ， 并 写 了 某 些 数据 后 造成 的 。 作 为 -- 个 例子 ， 考 虑 下 列 情况 : 


$ ls -l core 


-rw-r--r-- 1 sar 8483248 Nov 18 12:18 core 
$ du -s core 
272 core. 


文件 core 的 长 度 刚 好 超过 8 MB 字 节 ， 而 du 命令 则 报告 该 文件 所 使 用 的 磁盘 空间 总 量 是 
272 个 512 字 节 块 (139 264 字 节 ) (在 很 多 BSD 类 系统 上 ，du 命 令 报 告 1024 字 节 块 块 数 ，Solaris 
则 报告 512 字 节 块 块 数 )。 很 明显 ， 此 文件 中 有 很 多 空洞 。 

正如 我 们 在 3.6 节 中 提 及 的 ， 对 于 没有 写 过 的 字 节 位 置 ，read 国 数 读 到 的 字 节 是 0。 如 果 执 行 ， 


$ wc -c core 
8483248 core 


由 此 可 见 ， 正 常 的 MO 操作 读 整 个 文件 长 度 ( 带 -选项 的 wc(D) 命 邻 用 于 统计 文件 中 的 字符 GET) 
数 ) 。 


如 果 使 用 实用 程序 (例如 cat(1)) 复制 这 种 文件 ， 那 么 所 有 这 些 空洞 都 会 被 填 满 ， 其 中 所 
有 实际 数据 字 节 皆 填 写 为 0。 

$ cat core > core.copy 

$ ls -1 córe* 

-rw-r--r-- 1 sar 8483248 Nov 18 12:18 core 

-rw-rw-r-- 1 sar 8483248 Nov 18 12:27 core.copy 
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$ du -s core* 
272 core 
16592 core .copy 


从 中 可 见 ， 新 文件 所 用 的 实际 字 节 数 是 8 495 104 (512x16 592)。 此 长 度 与 1s 命 令 报告 的 长 度 
不 同 ， 其 原因 是 ， 文 件 系统 使 用 了 若干 块 以 存放 指向 实际 数据 块 的 各 个 指针 。 

有 兴趣 的 读者 应 当 参 阅 Bach[1986] 的 4.2 节 ，McKusick 等 [1996] 的 7.2 节 和 7.3 节 (或 
McKusick 和 Nevile-Neil[2005] 的 8.2 节 和 8.3 节 ) 以 及 Mauro 和 McDougall[2001] 的 14.2 节 ， 以 更 详 


细 地 了 解 文件 的 物理 结构 。 


4.13 文件 截 短 


有 时 我 们 需要 在 文件 尾 端 处 截 去 一 些 数据 以 缩短 文件 。 将 一 个 文件 清空 为 0 是 一 个 特例 ， 
在 打开 文件 时 使 用 0_TRUNC 标 志 可 以 做 到 这 一 点 。 


#include <unistd.h> 


int truncate(const char *pathname, off_t length) ; 


int ftruncate (int filedes, off t length) ; 


两 个 函数 的 返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 一 1 





这 两 个 函数 将 把 现 有 的 文件 长 度 截 短 为 length 字 节 。 如 果 读 文件 以 前 的 长 度 大 于 length， 则 超过 
length 以 外 的 数据 就 不 再 能 访问 。 如 果 以 前 的 长 度 短 于 length， 则 其 效果 与 系统 有 关 。 遵 循 XSI 
的 系统 将 增加 该 文件 的 长 度 。 若 UNIX 系 统 实现 扩展 了 该 文件 ， 则 在 以 前 的 文件 尾 端 和 新 的 文 
件 尾 端 之 间 的 数据 将 读 作 0 (也 就 是 可 能 在 文件 中 创建 了 一 个 空洞 )。 


ftruncate 函 数 是 POSIX.1 的 组 成 部 分 。 在 Single UNIX Specification}, truncate HRT VA 
POSIX.1 功 能 的 XSI 扩 展 部 分 。 

时 于 4.4BSD 的 系统 只 能 用 运 三 个 函数 截 短 一 个 文件 一 不 能 用 它们 扩展 一 个 文件 。 

Solaris 对 fcnt1 做 了 扩展 ， 增 加 了 F_FREESP 命 令 ， 它 克 许 释放 一 个 文件 中 的 任何 一 部 分 ， 而 不 只 
是 文件 尾 端 处 的 一 部 分 。 


程序 清单 13-2 中 的 程序 使 用 了 ftruncate 琉 数 ， 以 便 在 获得 一 个 文件 上 的 锁 后 ， 清 空 该 
文件 。 


4.14 文件 系统 


为 了 说 明文 件 链接 的 概念 ， 先 要 介绍 UNIX 文 件 系统 的 基本 结构 。 同 时 ， 了 解 i 节点 和 指向 i 
节点 的 目录 项 之 间 的 区 别 也 是 很 有 益 的 。 

目前 ， 正 在 使 用 的 UNIX 文 件 系 统 有 多 种 实现 。 例 如 ，Solaris 支 持 多 种 不 同类 型 的 磁盘 文 
件 系统 :传统 的 基于 BSD 的 UNIX 文 件 系 统称 为 UFS，UNIX file system) ， 读 、 写 DOS 格 式 
化 软盘 的 文件 系统 ( 称 为 PCFS) ， 以 及 读 CD 的 文件 系统 ( 称 为 HSFS)。 在 表 2-15 中 ， 我 们 已 
看 到 了 不 同类 型 文件 系统 之 间 的 -- 个 区 别 。UFS 是 以 BSD 快 速 文件 系统 为 基础 的 。 本 节 讨 论 该 
文件 系统 。 

我 们 可 以 把 一 个 磁盘 分 成 一 个 或 多 个 分 区 。 每 个 分 区 可 以 包含 一 个 文件 系统 ( 见 图 4-1)。 
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图 4-1 磁盘 、 分 区 和 文件 系统 


i 节点 是 固定 长 度 的 记录 项 ， 它 包含 有 关 文 件 的 大 部 分 信息 。 
如 果 更 仔细 地 观察 一 个 柱 面 组 的 i 节点 和 数据 块 部 分 ， 则 可 以 看 到 图 4-2 中 所 示 的 情况 。 





目录 块 和 数据 块 











[84-2 较 详细 的 柱 面 组 的 节点 和 数据 块 

注意 图 4-2 中 的 下 列 各 点 : 

。 在 图 中 有 两 个 目录 项 指向 同一 i 节 点 。 每 个 i 节 点 中 都 有 一 个 链接 计数 ， 其 值 是 指向 该 i 节 
点 的 目录 项 数 。 只 有 当 链 接 计数 减少 至 0 时 ， 才 可 删除 该 文件 (也 就 是 可 以 释放 该 文件 占 
用 的 数据 块 ) 。 这 就 是 为 什么 “解除 对 一 个 文件 的 链接 ”操作 并 不 总 是 意味 着 “释放 该 文 
件 占用 的 磁盘 块 ”的 原因 。 这 也 是 为 什么 删除 一 个 目录 项 的 函数 被 称 为 unlLink 而 不 是 
delete 的 原因 。 在 stat 结 构 中 ， 链 接 计数 包含 在 st_nlink 成 员 中 ， 其 基本 系统 数据 
类 型 是 nlink_t。 这 种 链接 类 型 称 为 硬 链接 。 回 忆 2.5.2 节 ， 其 中 ，POSIX.1 常 量 
LINK_MAX 指 定 了 一 个 文件 链接 数 的 最 大 值 。 

。 另 外 一 种 链接 类 型 称 为 符号 链接 (symbolic link)。 对 于 这 种 链接 ， 该 文件 的 实际 内 容 
(在 数据 块 中 ) 包含 了 该 符号 链接 所 指向 的 文件 的 名 字 。 在 下 例 中 : 


lrwxrwxrwx 1 root 7 Sep 25 07:14 lib -> usr/lib 
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该 目录 项 中 的 文件 名 是 3 字符 的 字符 串 1ib， 而 在 该 文件 中 包含 了 7 个 数据 字 节 usr/1ib。 
该 i 节点 中 的 文件 类 型 是 Ss_IFLNK， 于 是 系统 知道 这 是 一 个 符号 链接 。 

“i 节点 包含 了 大 多 数 与 文件 有 关 的 信息 : 文件 类 型 、 文 件 访问 权限 位 、 文 件 长 度 和 指向 该 
文件 所 占用 的 数据 块 的 指针 等 等 。stat 结 构 中 的 大 多 数 信息 都 取 自 节点 。 只 有 两 项 数据 
存放 在 目录 项 中 : 文件 名 和 i 节 点 编号 。i 节 点 编号 的 数据 类 型 是 ino_ 上。 

* 每 个 文件 系统 各 自 对 它们 的 i 节点 进行 编号 ， 因 此 目录 项 中 的 i 节点 编号 数 指向 同一 文件 系 
统 中 的 相应 i 节点， 不 能 使 一 个 目录 项 指向 另 一 个 文件 系统 的 i 节点。 这 就 是 为 什么 1n(1) 
命令 (构造 一 个 指向 一 个 现 有 文件 的 新 目录 项 ) 不 能 跨越 文件 系统 的 原因 。 我 们 将 在 下 
一 节 说 明 1ink 国 数 。 

* 当 在 不 更 换文 件 系统 情况 下 为 一 个 文件 更 名 时 ， 该 文件 的 实际 内 容 并 未 移动 ， 只 需 构 造 
一 个 指向 现 有 i 节点 的 新 目录 项 ， 并 解除 与 旧 目 录 项 的 链接 。 例 如 ， 为 将 文件 /usr/1ib/ 
foo 更 名 为 /usr/foo， 如 果 目 录 /usr/1Lib 和 /usr 在 同一 文件 系统 中 ， 则 文件 Eoo 的 内 
容 无 需 移 动 。 这 就 是 mv(1) 命 令 的 通常 操作 方式 。 

我 们 说 明了 普通 文件 的 链接 计数 概念 ， 但 是 对 于 目录 文件 的 链接 计数 字段 又 如 何 呢 ? 假定 
我 们 在 工作 目录 中 构造 了 一 个 新 目录 ， 


$ mkdir testdir 


图 4-3 显 示 了 其 结果 。 注 意 ， 该 图 显 式 地 显示 了 .和 .. 目 录 项 。 









目录 块 和 数据 块 — 


oc 


i 节 点 数组 





dirum a 
2549 | testdir 


图 4-3 创建 了 目录 testdir 后 的 示例 柱 形 组 


对 于 编号 为 2549 的 i 节点 ， 其 类 型 字段 表示 它 是 一 个 目录 ， 而 链接 计数 为 2。 任 何 一 个 叶 目 
录 (不 包含 任何 其 他 目录 的 目录 ) 的 链接 计数 总 是 x， 数值 来自 于 命名 该 目录 (testdir) 的 
目录 项 以 及 在 该 目录 中 的 .项 。 对 于 编号 为 1267 的 i 节点 ， 其 类 型 字段 表示 它 是 一 个 目录 ， 而 其 
链接 计数 则 大 于 或 等 于 3。 它 大 于 或 等 于 3 的 原因 是 ， 至 少 有 三 个 目录 项 指向 它 ， 一 个 是 命名 它 
的 目录 项 (在 图 4-3 中 没有 表示 出 来 )， 第 二 个 是 在 该 目录 中 的 .项 ,第 三 个 是 在 其 子 目录 
testdir 中 的 .. Jj. 注意 ， 父 目录 中 的 每 一 个 子 目 录 都 会 使 该 父 目录 的 链接 计数 增 1。 

这 种 格式 与 UNIX 文 件 系统 的 经 典 格式 类 似 ， 在 Bach[1986] 一 书 的 第 4 章 中 对 此 作 了 详细 说 
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明 。 关 于 伯克利 快速 文件 系统 对 此 所 作 的 更 改 请 参阅 McKusick 等 人 [1996] 的 第 7 章 或 McKusick 
和 Nevile-Neil[2005] 中 的 第 8 章 。 关 于 UFS (伯克利 快速 文件 系统 的 Solaris 版 ) 的 详细 情况 ， 请 
参见 Mauro 和 McDougall[2001] 的 第 14 章 。 


4.15 link, unlink, removeffrename mex 


如 上 节 所 述 ， 任 何 一 个 文件 可 以 有 多 个 目录 项 指向 其 i 节 点 。 创 建 一 个 指向 现 有 文件 的 链接 
的 方法 是 使 用 link 函 数 。 


#include <unistd.h> 


int link(const char *existingpath, const char *newpath) ; 
返回 值 : 若 成 功 则 返回 0， 若 出 错 则 返回 -1 





此 函数 创建 一 个 新 目录 项 newpath， 它 引用 现 有 的 文件 existingpath。 如 车 newpath 已 经 存在 ， 则 
返回 出 错 。 只 创建 newpath 中 的 最 后 一 个 分 量 ， 路 径 中 的 其 他 部 分 应 当 已 经 存在 。 

创建 新 目录 项 以 及 增加 链接 计数 应 当 是 个 原子 操作 (请 回忆 在 3.11 节 中 对 原子 操作 的 讨论 )。 
虽然 POSIX.1 允 许 实现 支持 跨 文 件 系 统 的 链接 ， 但 是 大 多 数 实现 要 求 这 两 个 路 径 名 在 同一 个 文 
件 系 统 中 。 如 果实 现 支持 创建 指向 一 个 目录 的 硬 链接 ， 那 么 也 仅 限于 超级 用 户 才 可 以 这 样 做 。 
其 理由 是 这 样 做 可 能 在 文件 系统 中 形成 循环 ， 大 多 数 处 理 文件 系统 的 实用 程序 都 不 能 处 理 这 种 
情况 (4.16 节 将 说 明 一 个 由 符号 链接 引入 的 循环 的 例子 )。 因 此 很 多 文件 系统 实现 不 允许 对 于 目 
录 的 硬 链接 。 

为 了 删除 一 个 现 有 的 目录 项 ， 可 以 调用 unlink 函 数 。 


#include <unistd.h> 


int unlink(const char *pathname) ; 





返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 -1 


此 函数 删除 目录 项 ， 并 将 由 pathname 所 引用 文件 的 链接 计数 减 1。 如 果 还 有 指向 该 文件 的 其 他 
链接 ， 则 仍 可 通过 其 他 链接 访问 该 文件 的 数据 。 如 果 出 错 ， 则 不 对 该 文件 做 任何 更 改 。 

我 们 在 前 面 已 经 提 及 ， 为 了 解除 对 文件 的 链接 ， 必 须 对 包含 该 目录 项 的 目录 具有 写 和 执行 
权限 。 正 如 4.10 节 所 述 ， 如 果 对 该 目录 设置 了 粘 住 位 ， 则 对 该 目录 必须 具有 写 权 限 ， 并 且 具 备 
下 面 三 个 条 件 之 一 : 

“拥有 该 文件 。 

“拥有 该 目录 。 

“具有 超级 用 户 特 权 。 

只 有 当 链 接 计数 达到 0 时 ， 该 文件 的 内 容 才 可 被 删除 。 另 一 个 条 件 也 会 阻止 删除 文件 的 内 
只 要 有 进程 打开 了 该 文件 ， 其 内 容 也 不 能 删除 。 关 闭 一 个 文件 时 ， 内 核 首先 检查 打开 该 





容 


文件 的 进程 数 。 如 果 该 数 达 到 0， 然 后 内 核 检查 其 链接 数 ， 如 果 这 个 数 也 是 0， 那 么 就 删除 该 文 
件 的 内 容 。 





程序 清单 4-5 中 的 程序 打开 一 个 文件 ， 然 后 解除 对 它 的 锁定 。 执 行 该 程序 的 进程 然后 休眠 15 
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秒 钟 ， 接 着 就 终止 。 
程序 清单 4-5 打开 一 个 文件 ， 然 后 unlink 它 


#include "apue.h" 
#include «fcntl.h» 
int 

main (void) 


if (open("tempfile", O_RDWR) < 0) 
err_sys ("open error"); 

if (unlink("tempfile") < 0) 
err_sys ("unlink error"); 

printf("file unlinked\n"); 

sleep (15); 

printf ("done\n") ; 

exit (0); 


} 
运行 该 程序 ， 其 结果 是 ; 





$ ls -1 tempfile 查看 文件 大 小 
-~LW-L----- 1 sar 413265408 Jan 21 07:14 tempfile 
$ df /home 检查 可 用 磁盘 空间 
Filesystem 1K-blocks Used Available Use% Mounted on 
/dev/hda4 11021440 1956332 9065108 18% /home 
$ ./a.out & 在 后 台 运 行程 序 清单 4-5 
1364 shell 打 印 其 进程 ID 
$ file unlinked 文件 去 链接 
ls -l tempfile 观察 文件 是 否 仍然 存在 
ls: tempfile: No such file or directory ”目录 项 已 删除 
$ df /home 检查 可 用 磁盘 空间 有 无 变化 
Filesystem 1K-blocks Used Available Use% Mounted on 
/dev/hda4 11021440 1956332 9065108 18%  /home 
$ done 程序 执行 结束 ， 关 闭 所 有 打开 的 文件 
df /home 现在 ， 应 当 有 更 多 可 用 的 磁盘 空间 
Filesystem 1K-blocks Used Available Use% Mounted on 
/dev/hda4 11021440 1552352 9469088 15% /home 
BLE, 394.1 MB 的 磁盘 空间 可 用 Lj 


unlink 的 这 种 性 质 经 常 被 程序 用 来 确保 即使 是 在 该 程序 崩溃 时 ， 它 所 创建 的 临时 文件 也 
不 会 遗留 下 来 。 进 程 用 open 或 creat 创 建 一 个 文件 ， 然 后 立即 调用 unlink。 因 为 该 文件 仍旧 
是 打开 的 ， 所 以 不 会 将 其 内 容 删除 。 只 有 当 进 程 关 闭 该 文件 或 终止 时 (在 这 种 情况 下 ， 内 核 会 
关闭 该 进程 打开 的 全 部 文件 ) ， 该 文件 的 内 容 才 会 被 删除 。 

如 果 pathname 是 符号 链接 ， 那 么 un1ink 删 除 该 符 号 链接 ， 而 不 会 删除 由 该 链接 所 引用 的 
文件 。 给 出 符号 链接 名 情况 下 ， 没 有 一 个 函数 能 删除 由 该 链接 所 引用 的 文件 。 

超级 用 户 可 以 调用 un1link， 其 参数 patpname 指 定 一 个 目录 ， 但 是 通常 应 当 使 用 rmdqir 函 
数 ， 而 不 使 用 这 种 方式 。 我 们 将 在 4.20 节 中 说 明 r*mair 函 数 。 

我 们 也 可 以 用 remove 函 数 解除 对 一 个 文件 或 目录 的 链接 。 对 于 文件 ，remove 的 功能 与 
unlink 相 同 。 对 于 目录 ，remove 的 功能 与 rmdir 相 同 。 


#include <stdio.h> 


int remove(const char *pathname) ; 


返回 值 ， 若 成 功 则 返回 9， 若 出 错 则 返回 一 1 
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ISO C 指 定 remove 函 数 删 除 一 个 文件 ， 这 有 更改 了 UNIX 历 来 使 用 的 名 字 unlink， 其 原因 是 实现 C 标 
准 的 大 多 数 非 UNIX 系 统 并 不 支持 文件 链接 。 


文件 或 目录 用 rename 函 数 更 名 。 


#include <stdio.h> 


int rename(const char *oldname, const char *newname) ; 


返回 值 : 若 成 功 则 返回 0， 若 出 错 则 返回 一 1 





ISO C 对 文件 定义 了 此 函数 〈C 标 准 不 处 理 目录 )。POSIX.1 扩 展 此 定义 ， 使 其 包含 了 目录 和 符号 
链接 。 


根据 oldname 是 指 文件 还 是 目录 ， 有 几 种 情况 要 加 以 说 明 。 我 们 也 应 说 明 如 果 newname 已 经 
存在 将 会 发 生 什么 。 

(1) 如 果 oldname 指 的 是 一 个 文件 而 不 是 目录 ， 那 么 为 该 文件 或 符号 链接 更 名 。 在 这 种 情况 
下 ， 如 果 newname 已 存在 ， 则 它 不 能 引用 一 个 目录 。 如 果 newname 已 存在 ,而 且 不 是 一 个 目录 ， 
则 先 将 该 目录 项 删除 然后 将 oldname 更 名 为 rewname。 对 包含 oldname 的 目录 以 及 包含 hewname 
的 目录 ， 调 用 进程 必须 具有 写 权 限 ， 因 为 将 更 改 这 两 个 目录 。 

(2) 如 车 oldname 指 的 是 一 个 目录 ， 那 么 为 该 目录 更 名 。 如 果 newname 已 存在 ， 则 它 必 须 引 
用 一 个 目录 ， 而 且 该 目录 应 当 是 空 目录 ( 空 自 录 指 的 是 该 目录 中 只 有 .和 .. 项 )。 如 果 newname 存 
在 〈 而 且 是 一 个 空 目录 ) ， 则 先 将 其 删除 ， 然 后 将 oldmrame 更 名 为 mnewname。 另 外 ， 当 为 一 个 目 
录 更 名 时 ，newname 不 能 包含 oldname 作 为 其 路 径 前 级 。 例 如 ， 不 能 将 /usr/foo 更 名 为 /usr/ 
foo/testdir， 因 为 旧名 字 (/usr/foo) 是 新 名 字 的 路 径 前 级 ， 因 而 不 能 将 其 删除 。 

(3) 如 车 oldname 或 newname 引 用 符号 链接 ， 则 处 理 的 是 符号 链接 本 身 ， 而 不 是 它 所 引用 的 
文件 。 

(4) 作为 一 个 特例 ， 如 果 oldname 和 newname 引 用 同一 文件 ， 则 函数 不 做 任何 更 改 而 成 功 返 回 。 

如 车 newname 已 经 存在 ， 则 调用 进程 对 它 需 要 有 写 权限 (如 同 删除 情况 一 样 )。 另 外 ， 调 用 
进程 将 删除 oldname 目 录 项 ， 并 可 能 要 创建 rewname 目 录 项 ， 所 以 它 需 要 对 包含 oldnume 及 包含 
newname 的 自 录 具 有 写 和 执行 权限 。 


4.16 符号 链接 


符号 链接 是 指向 一 个 文件 的 间接 指针 ， 它 与 上 一 节 所 述 的 硬 链接 有 所 不 同 ， 硬 链接 直接 指 
向 文件 的 节点。 引入 符号 链接 的 原因 是 为 了 避 开 硬 链接 的 一 些 限制 : 

© 硬 链接 通常 要 求 链接 和 文件 位 于 同一 文件 系统 中 。 

。 只 有 超级 用 户 才 能 创建 指向 目录 的 硬 链接 。 

对 符号 链接 以 及 它 指向 何 种 对 象 并 无 任何 文件 系统 限制 ， 任 何 用 户 都 可 创建 指向 目录 的 符 
号 链接 。 符 号 链接 一 般 用 于 将 一 个 文件 或 整个 目录 结构 移 到 系统 中 的 另 一 个 位 置 。 


符号 链接 由 4.2BSD 引 入 ,后 来 又 得 到 SVR4 的 支持 。 
当 使 用 以 名 字 引 用 文件 的 函数 时 ， 应 当 了 解 该 函数 是 否 处 理 符号 链接 。 也 就 是 该 函数 是 否 
跟随 符号 链接 到 达 它 所 链接 的 文件 。 如 车 该 函数 具有 处 理 符 号 链接 的 功能 ， 则 其 路 径 名 参数 引 
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用 由 符号 链接 指向 的 文件 。 否 则 ， 路 径 名 参数 将 引用 链接 本 身 ， 而 不 是 该 链接 指向 的 文件 。 表 4- 
9 列 出 了 本 章 中 所 说 明 的 各 个 函数 是 否 处 理 符 号 链接 。 在 表 4-9 中 没有 列 出 mkdrir、mkinfo、 
mknod 和 rmdir 这 些 函 数 ， 其 原因 是 ， 当 路 径 名 是 符号 链接 时 ， 它 们 都 出 错 返 回 。 以 文件 描述 
符 作为 参数 的 一 些 函 数 (如 fstat、fchmod 等 ) 也 未 在 该 表 中 列 出 ， 其 原因 是 ， 对 符号 链接 的 
处 理 是 由 返回 文件 描述 符 的 函数 (通常 是 open) 进行 的 。chowmn 是 否 跟随 符号 链接 取决 于 实现 。 

在 Linux 2.1.81 之 前 的 各 版 本 中 ，chown 并 不 跟随 村 号 链接 。 从 2.1.81 版 开始 ，chown 跟 随 符 号 链接 。 
FreeBSD 5.2.1feMac OS X 10.3 中 的 chown 跟 随 符号 链接 。( 在 4.4BSD 之 前 ，chown 不 跟随 符号 链接 ， 


但 在 4.4BSD 中 这 得 到 改变 。) 在 Solaris 9 中 ，chown 也 跟随 符号 链接 。 所 有 这 些 平台 都 实现 了 lchown， 
以 改变 竺 号 链接 自身 的 所 有 权 。 


表 4-9 的 一 个 例外 是 ， 同 时 用 0_CREAT 和 0O_EXCL 两 者 调用 open 函 数 。 在 此 情况 下 ， 若 路 
径 名 引用 符号 链接 ，open 将 出 错 返回 ， 并 将 errno 设 置 为 BEEXIST。 这 种 处 理 方式 的 意图 是 堵 
塞 一 个 安全 性 漏洞 ， 使 具有 特权 的 进程 不 会 被 诱骗 对 不 适当 的 文件 进行 写 操作 。 


表 4-9 各 个 函数 对 符号 链接 的 处 理 


不 眼 随 符号 链接 ”| 。 跟随 符号 链接 


实 pi 


使 用 符号 链接 可 能 在 文件 系统 中 引入 循环 。 大 多 数 查找 路 径 名 的 函数 在 这 种 情况 发 生 时 都 
将 返回 值 为 BLOOP 的 errno。 考 虑 下 列 命令 序列 : 





access 
chdir 
chmod 








chown 





creat 






exec 






lchown 


link 






lstat 







open 






opendir 


pathconf 





readlink 






remove 






rename 






stat 






truncate 





unlink 





$ mkdir foo 创建 一 个 新 目录 
$ touch foo/a 创建 0 长 文件 

$ ln -s ../foo foo/testdir 创建 符号 链接 
$ ls -1 foo 

total 0 
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-YW-r----- 1 sar 0 Jan 22 00:16 a 
lrwxrwxrwx 1 sar 6 Jan 22 00:16 testdir -» ../foo 


这 创建 了 一 个 目录 fco， 它 包含 了 一 个 名 为 a 的 文件 以 及 一 个 指向 foo 的 符号 链接 。 在 图 4-4 
中 显示 了 这 种 结果 ， 图 中 以 圆 表示 目录 ， 以 正方 形 表示 一 个 文件 。 如 果 我 们 编写 一 段 简单 的 程 
序 ， 使 用 Solaris 的 标准 函数 ftw(3) 以 降序 遍历 文件 结构 ， 打 印 每 个 遇 到 的 路 径 名 ， 则 其 输出 是 : 


foo 

foo/a 

foo/testdir 

foo/testdir/a 
foo/testdir/testdir 
foo/testdir/testdir/a 
foo/testdir/testdir/testdir 
foo/testdir/testdir/testdir/a 


(更 多 行 、 直 至 ftw 出 错 返 回 ， 此 时 ，ermo 值 为 ELOOP.。) 





图 4-4 ”构成 循环 的 符号 链接 testdir 
4.21 节 提供 了 我 们 自己 的 ftw 函 数 版 本 ， 它 用 lstat 代 替 stat 以 阻止 它 跟 随 符号 链接 。 
注意 ，Linux 的 ftw 函 数 使 用 lstatl， 所 以 它 不 显示 这 种 程序 运行 行为 。 


这 样 一 个 循环 是 很 容易 消除 的 。 因 为 un1link 并 不 跟随 符号 链接 ， 所 以 可 以 unlink 文 件 
foo/testdir。 但 是 如 果 创 建 了 一 个 构成 这 种 循环 的 硬 链接 ， 那 么 就 很 难 消 除 它 。 这 就 是 为 
什么 link 函 数 不 允 许 构 造 指 向 目录 的 硬 链 接 的 原因 (除非 进程 具有 超级 用 户 特权 )。 


实际 上 ，Rich Stevens 在 改写 本 节 的 原始 版 本 时 ， 在 自己 的 系统 上 做 了 一 个 这 样 的 实验 。 文 件 系统 
变 得 错误 百出 。 正 常 的 fsck(1) 实 用 程序 不 能 解决 问题 。 为 了 修复 文件 系统 。 不 得 不 使 用 了 并 不 推荐 使 
用 的 工具 clri(8) 和 dcheck(8)。 


需要 对 目录 的 硬 链 接 是 由 来 已 久 的 ， 但 是 使 用 符号 链接 和 mdir 函 数 ， 用 户 就 不 再 需要 创建 指向 
目录 的 硬 链 接 了 。 


用 open 打 开 文件 时 ， 如 果 传 递 给 open 函 数 的 路 径 名 指定 了 一 个 符号 链接 ， 那 么 open 跟 随 
此 链接 到 达 你 所 指定 的 文件 。 若 此 符号 链接 所 指向 的 文件 并 不 存在 ， 则 open 返 回 出 错 ， 表 示 
它 不 能 打开 该 文件 。 这 可 能 会 使 不 熟悉 符号 链接 的 用 户 感到 迷惑 ， 例 如 ; 


$ In -e /no/such/file myfile 创建 符号 链接 

$ 1s myfile 

myfile 1s 查 到 该 文件 

$ cat myfile 试图 查看 该 文件 

cat: myfile: No such file or directory 

$ 1s -1 myfile 尝试 -1 选项 

lrwxrwxrwx 1 sar 13 Jan 22 00:26 myfile -> /no/such/file 
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文件 myfile 存 在 ,但 cat 却 称 没有 这 一 文件 。 其 原因 是 myfile 是 个 符号 链接 ， 由 该 符号 


链接 所 指向 的 文件 并 不 存在 。1s 命 令 的 -1 选项 给 我 们 两 个 提示 : 第 一 个 字符 是 1 ， 它 表示 这 是 
一 个 符号 链接 ， 而 一 > 也 表示 这 是 一 个 符号 链接 。1s 命 令 还 有 另 一 个 选项 -F， 它 在 符号 链接 的 
文件 名 后 加 一 个 @ 符 号 ， 在 未 使 用 -1 选项 时 ， 这 可 以 帮助 识别 出 符号 链接 。 口 


4.17 symlink 和 read1ink 函 数 
symlink 函 数 创 建 一 个 符号 链接 。 


#include <unistd.h> 


int symlink(const char *actualpath, const char *sympath) ; 
返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 -1 


该 函数 创建 了 一 个 指向 actualpath 的 新 目录 项 sympath， 在 创建 此 符号 链接 时 ， 并 不 要 求 
actualpath 已 经 存在 (在 上 一 节 结 束 部 分 的 例子 中 我 们 已 经 看 到 了 这 一 点 )。 并 且 ，actualpath 和 
sympath 并 不 需要 位 于 同一 文件 系统 中 。 

因为 open 函 数 跟随 符号 链接 , 所 以 需要 有 一 种 方法 打开 该 链接 本 身 ， 并 读 该 链接 中 的 名 
字 。read1link 涌 数 提供 了 这 种 功能 。 





#include <unistd.h> 


ssize t readlink(const char* restrict pathname, char *restrict buf, 
size t bufsize) ; 





返回 值 : 车 成 功 则 返回 读 到 的 字 节 数 ， 若 出 错 则 返回 ~1 


此 函数 组 合 了 open、read 和 close 的 所 有 操作 。 如 果 此 函数 成 功 执行 ， 则 它 返 回 读 人 
buf 的 字 节 数 。 在 buf 中 返回 的 符号 链接 的 内 容 不 以 null 字 符 终止。 


4.18 文件 的 时 间 
对 每 个 文件 保持 有 三 个 时 间 字 段 ， 它 们 的 意义 示 于 表 4-10 中 。 
表 4-10 与 每 个 文件 相关 的 三 个 时 间 值 


| ea | 9 x | 


st_atime 文件 数据 的 最 后 访问 时 间 read -u 
st_mtime 文件 数据 的 最 后 修改 时 间 write 
st_ctime i 节点 状态 的 最 后 更 改 时 间 chmod、chown 


注意 修改 时 间 (st mtime) 和 更 改 状态 时 间 (st ctime) 之 间 的 区 别 。 修 改 时 间 是 文 
件 内 容 最 后 一 次 被 修改 的 时 间 。 更 改 状态 时 间 是 该 文件 的 节点 最 后 一 次 被 修改 的 时 间 。 在 本 章 
中 我 们 已 说 明了 很 多 影响 到 i 节点 的 操作 ， 例 如 ， 更 改 文件 的 访问 权限 、 用 户 ID、 链 接 数 等 ， 但 
它们 并 没有 更 改 文件 的 实际 内 容 。 因 为 节点 中 的 所 有 信息 都 是 与 文件 的 实际 内 容 分 开 存 放 的 ， 
所 以 ， 除 了 文件 数据 修改 时 间 以 外 ， 还 需要 更 改 状态 的 时 间 。 

福 意 ， 系 统 并 不 保存 对 一 个 i 节点 的 最 后 一 次 访问 时 间 ， 所 以 access 和 stat 函 数 并 不 更 改 
这 三 个 时 间 中 的 任 一 个 。 
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系统 管理 员 常 常 使 用 访问 时 间 来 删除 在 一 定 的 时 间 范 围 内 没有 访问 过 的 文件 。 典 型 的 例子 
是 删除 在 过 去 一 周 内 没有 访问 过 的 名 为 a. PRENE find (1) 命令 常 被 用 来 进行 
这 类 操作 。 

——————Hm 

1s 命 令 按 这 三 个 时 间 值 中 的 一 个 排序 进行 显示 。 按 系统 默认 (用 -1 或 -t 选 项 调用 时 ) v 
按 文件 的 修改 时 间 的 先后 排序 显示 。-u 选 项 使 其 用 访问 时 间 排 序 ，- c 选 项 则 使 其 用 更 改 状 态 
时 间 排 序 。 

表 4-11 列 出 了 我 们 已 说 明 过 的 各 种 函数 对 这 三 个 时 间 的 作用 。 回 忆 4.14 节 中 所 述 ， 目 录 是 包 
含 目 录 项 (文件 名 和 相关 的 i 节 点 编号 ) 的 文件 ， 增 加 、 删 除 或 修改 目录 项 会 影响 到 与 其 所 在 目 
录 相 关 的 三 个 时 间 。 这 就 是 在 表 4-11 中 包含 两 列 的 原因 ， 其 中 一 列 是 与 该 文件 (或 目录 ) 相关 
的 三 个 时 间 ， 另 一 列 是 与 所 引用 的 文件 (或 目录 ) 的 父 目录 相关 的 三 个 时 间 。 例 如 ， 创 建 一 个 
新 文件 会 影响 到 包含 此 新 文件 的 目录 ， 也 会 影响 该 新 文件 的 i 节 点 。 但 是 ， 读 或 写 一 个 文件 只 会 
影响 该 文件 的 节点， 而 对 父 目 录 则 无 影响 (mkdir #lrmdir Mac E4. 2077 PAA, utimetW 
数 将 在 下 一 节 中 说 明 。6 个 exec 函 数 将 在 8.10 节 中 讨论 。 第 15 章 将 说 明 mkfifo 和 pipe 函 数 )。 


34-11 各 种 函数 对 访问 、 修 改 和 更 改 状 态 时 间 的 作用 


chmod, fchmod 

chown, fchown 

creat : O_CREAT 新 文件 
creat O_TRUNC 现 有 文件 
exec 

lchown 

link : 第 二 个 参数 的 父 目 录 
mkdir 

mkfifo 

open ; O CREATE X fE 
open : O_TRUNC 现 有 文件 
Pipe 

read 

remove : 删除 文件 -unlink 
remove : 删除 目录 =rmdir 
rename . 对 于 两 个 参数 
rmdir 

truncate, ftruncate 

unlink 


utime 





write 


4.19 utime 函 数 
一 个 文件 的 访问 和 修改 时 间 可 以 用 utime 函 数 更 改 。 
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#include <utime.h> 


int utime(const char *pathname, const struct utimbuf *times) ; 


返回 值 : 若 成 功 则 返回 0， 若 出 错 则 返回 -1 





此 函数 所 使 用 的 数据 结构 是 ， 
struct utimbuf { 
time t actime; /* access time */ 
time t modtime; /* modification time */ 
此 结构 中 的 两 个 时 间 值 是 日 历时 间 。 如 1.10 节 中 所 述 ， 这 是 自 1970 年 1 月 1 日 00:00:00 以 来 国际 
标准 时 间 所 经 过 的 秒 数 。 
此 函数 的 操作 以 及 执行 它 所 要 求 的 特权 取决 于 tmes 参 数 是 否 是 NULL。 
“如果 times 是 一 个 空 指针 ， 则 访问 时 间 和 修改 时 间 两 者 都 设置 为 当前 时 间 。 为 了 执行 此 操 
作 必 须 满足 下 列 两 条 件 之 一 ， 进程 的 有 效用 户 ID 必须 等 于 该 文件 的 所 有 者 ID ， 或 者 进程 
对 该 文件 必须 具有 写 权 限 。 
。 如 果 times 是 非 空 指针 ， 则 访问 时 间 和 修改 时 间 被 设置 为 times 所 指向 结构 中 的 值 。 此 时 ， 
进程 的 有 效用 户 ID 必须 等 于 该 文件 的 所 有 者 ID ， 或 者 进程 必须 是 一 个 超级 用 户 进程 。 对 
文件 只 具有 写 权 限 是 不 够 的 。 
注意 ， 我 们 不 能 对 更 改 状 态 时 间 st_ctime 指 定 一 个 值 ， 当 调用 utime 国 数 时 ， 此 字段 将 
被 自动 更 新 。 
在 基 些 UNIX 系 统 版 本 中 ，touch(1) 命 令 使 用 此 函数 。 另 外 ， 标 准 归档 程序 tar(1) 和 
cpio(1) 可 选 地 调用 utime， 以 便 将 一 个 文件 的 时 间 设 置 为 将 它 归 档 时 保存 的 时 间 值 。 





程序 清单 4-6 中 的 程序 使 用 带 0_TRUNC 选 项 的 copen 函 数 将 文件 长 度 截 短 为 0， 但 并 不 更 改 
其 访问 时 间 及 修改 时 间 。 为 了 做 到 这 一 点 ， 首 先 用 stat 函 数 得 到 这 些 时 间 ， 然 后 截 短文 件 ， 
最 后 再 用 utime 函 数 复位 这 两 个 时 间 。 


程序 清单 4-6 utime 函 数 实 例 


#include "apue.h" 

#include «fcentl.h» 

#include <utime.h> 

int 

main(int argc, char *argv[]l) 


int i, fd; 
struct stat Statbuf; 
Struct utimbuf  timebuf; 


for (i = 1; i « argc; i++) { 
if (stat(argv[i], &statbuf) < 0) [ /* fetch current times */ 
err ret("$s: stat error", argv[il); 
continue; 


if ((fd = open(argv[i], O_RDWR | O TRUNC)) « 0) { /* truncate */ 


err ret("$s: open error", argv[il):; 
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continue; 
close (fd); 
timebuf.actime = statbuf.st atime; 
timebuf.modtime = statbuf.st mtime; 
if (utime(argv[i], &timebuf) < 0) { /* reset times */ 
err ret("$s: utime error", argv[i]); 
continue; 
) 
) 
exit (0); 





可 以 用 以 下 脚本 演示 程序 清单 4-6 中 的 程序 : 


$ 1s -1 changemod times 查看 长 度 和 最 后 修改 时 间 
-rwxrwxr-X 1 sar 15019 Nov 18 18:53 changemod 
-rwxrwxr-x 1 sar 16172 Nov 19 20:05 times 

$ 1s -lu changemod times 查看 最 后 访问 时 间 
-rwxrwxr-x 1 sar 15019 Nov 18 18:53 changemod 
-rwxrwxr-x 1 sar 16172 Nov 19 20:05 times 


$ dete 打印 当天 日 期 

Thu Jan 22 06:55:17 EST 2004 

$ ./a.out changemod times 运行 图 4-21 程 序 

$ ls -1 changemod times 检查 结果 

-rwxrwxr-X 1 sar 0 Nov 18 18:53 changemod 

-rwxrwxr-xX 1 sar 0 Nov 19 20:05 times 

$ 1s -lu changemod times 检查 最 后 访问 时 间 

-rwxrwxr-x 1 sar 0 Nov 18 18:53 changemod 

-rwxrwxr-x 1 sar 0 Nov 19 20:05 times 

$ 1s -lc changemod times 检查 更 改 状态 时 间 

-rwxrwxr-X 1 sar 0 Jan 22 06:55 changemod 

-rwxrwxr-x 1 sar 0 Jan 22 06:55 times 

正如 我 们 所 预见 的 一 样 ， 最 后 修改 时 间 和 最 后 访问 时 间 未 变 。 但 是 ， 更 改 状态 时 间 则 更 改 
为 程序 运行 时 的 时 间 。 口 


4.20 mkdir 和 rmdir 函 数 
用 mkdir 消 数 创建 目录 ， 用 rmdir 函 数 删除 目录 。 





#include <sys/stat.h> 


int mkdir(const char *pathname, mode t mode); 





返回 值 : 若 成 功 则 返回 0， 若 出 错 则 返回 一 1 


此 函数 创建 一 个 新 的 空 目 录 。 其 中 ，. 和 .. 目录 项 是 自动 创建 的 。 所 指定 的 文件 访问 权限 
mode 由 进程 的 文件 模式 创建 屏蔽 字 修 改 。 

常见 的 错误 是 指定 与 文件 相同 的 mode (只 指定 读 、 写 权限 )。 但 是 ， 对 于 目录 通常 至 少 要 
设置 1 个 执行 权限 位 ， 以 允许 访问 该 目录 中 的 文件 名 (见习 题 4.16)。 

按照 4.6 节 中 讨论 的 规则 ， 设 置 新 目录 的 用 户 ID 和 组 ID。 


Linux 2.4.22 和 Solaris 9 也 使 新 目录 继承 父 目 对 的 设置 组 ID 位 。 这 就 使 得 在 新 目录 中 创建 的 文件 将 
纺 承 该 目录 的 组 ID。 对 于 Linux， 文 件 系统 实现 决定 是 否 支 持 此 特征 。 例 如 ，ext2 和 ext3 文 件 系 统 用 
mount(1) 命 令 的 一 个 选项 来 控制 是 否 支持 此 特征 。 但 是 ，Linux 的 UFS 文 件 节 统 实现 则 是 不 可 选择 的 ， 
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新 目录 继承 父 目 录 的 设置 组 ID 位 ， 这 模仿 了 历史 上 BSD 的 实现 ， 在 BSD 系 统 中 ， 新 目录 的 组 ID 是 从 区 
目录 继承 的 。 

基于 BSD 的 系统 并 不 要 求 继承 此 设置 组 ID 位 ， 因 为 不 论 设 置 组 ID 位 如 何 ， 新 创建 的 文件 和 目录 总 
是 继承 父 目 录 的 组 ID。 因 为 FreeBSD 5.2.1 和 MAC OS X 10.3 是 基于 4.4BSD 的 ， 它 们 不 要 求 继 承 设置 组 
JP 位 。 在 这 些 平 台 上 ， 新 创建 的 文件 和 目录 总 是 继承 父 目 录 的 组 ID， 这 与 设置 组 ID 位 无 关 。 

早期 的 UNIX 版 本 并 没有 mkGir 函 数 ， 它 是 由 4.2BSD 和 SVR3 引 入 的 。 在 早期 版 本 中 ， 进 程 要 调用 
mnod 函 数 以 创建 一 个 新 目录 。 但 是 只 有 超级 用 户 进程 才能 使 用 miknod 函 数 。 为 了 避免 这 一 点 ， 创 建 目 
孙 的 命令 mkair(D) 必 须 由 根 用 户 拥有 ， 而 且 对 它 设 置 了 设置 用 户 ID 位 。 进 程 为 了 创建 一 个 目录 ， 必 须 
用 System(3) 函 数 调用 mkair(1) 命 令 。 


用 rmair 函 数 可 以 删除 一 个 空 目录 。 空 昌 录 是 只 包含 .和 .. 这 两 项 的 目录 。 


#include <unistd.h> 


int rmdir(const char *pathname) ; 





返回 值 : 若 成 功 则 返回 0， 若 出 错 则 返回 -1 


如 果 调 用 此 函数 使 目录 的 链接 计数 成 为 0， 并 且 也 没有 其 他 进程 打开 此 目录 ， 则 释放 由 此 
目录 占用 的 空间 。 如 果 在 链接 计数 达到 0 时 ， 有 一 个 或 几 个 进程 打开 了 此 目录 ， 则 在 此 函数 返 
回 前 删除 最 后 一 个 链接 及 . 和 .. 项 。 另 外 ， 在 此 目录 中 不 能 再 创建 新 文件 。 但 是 在 最 后 一 个 进程 
关闭 它 之 前 并 不 释放 此 目录 。( 即 使 另 一 个 进程 打开 该 目录 ， 它 们 在 此 目录 下 也 不 能 执行 其 他 
操作 。 这 样 处 理 的 原因 是 ， 为 了 使 rmair 函 数 成 功 执行 ， 该 目录 必须 是 空 的 。) 


4.21 REAR 


对 某 个 目录 具有 访问 权限 的 任 一 用 户 都 可 读 该 目录 ， 但 是 ， 为 了 防止 文件 系统 产生 混乱 ， 
只 有 内 核 才能 写 目录 。 回 忆 4.5 节 ， 一 个 目录 的 写 权限 位 和 执行 权限 位 决定 了 在 该 目录 中 能 和 否 创 
建新 文件 以 及 删除 文件 ， 它 们 并 不 表示 能 否 写 目 录 本 身 。 

目录 的 实际 格式 依赖 于 UNIX 系 统 ， 特 别 是 其 文件 系统 的 具体 设计 和 实现 。 早 期 的 系统 
(例如 V7) 有 一 个 比较 简单 的 结构 : 每 个 目录 项 是 16 个 字 节 ， 其 中 14 个 字 节 是 文件 名 ，2 个 字 节 
古 i 点 编号 。 而 对 于 4.2BSD 而 言 ， 由 于 它 允 许 相 当 长 的 文件 名 ， 所 以 每 个 目录 项 的 长 度 是 可 
变 的 。 这 就 意味 着 读 目录 的 程序 与 系统 相关 。 为 了 简化 这 种 情况 ，UNIX 现 在 包含 了 一 套 与 读 
目录 有 关 的 例 程 ， 它 们 是 POSIX.1 的 一 部 分 。 很 多 实现 阻止 应 用 程序 使 用 read 函 数 读 取 目 录 的 
内 容 ， 从 而 进一步 将 应 用 程序 与 目录 格式 中 与 实现 相关 的 细节 隔离 开 。 


#include «dirent.h» 








DIR *opendir(const char *pathname) ; 
返回 值 : 车 成 功 则 返回 指针 ， 若 出 错 则 返回 NULL 
struct dirent *readdir(DIR *dp) ; 
返回 值 : 车 成 功 则 返回 指针 ， 若 在 目录 结尾 或 出 错 则 返回 NULL 
void rewinddir(DIR *dp) ; 
int closedir(DIR *dp) ; 
返回 值 :车 成 功 则 返回 9， 若 出 错 则 返回 -1 
long telldir(DIR *dp); 
返回 值 : 与 dp 关联 的 目录 中 的 当前 位 置 
void seekdir(DIR *dp, long loc); 
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telldir 和 seekdir 函 数 不 是 基本 POSIX.1 标 准 的 组 成 部 分 。 它 们 是 Single UNIX 
Specification 中 的 XSI 扩 展 ， 所 以 可 以 期 望 所 有 遵循 UNIX 系 统 的 实现 都 会 提供 这 两 个 函数 。 
回忆 一 下 ， 在 程序 清单 1-1 中 的 程序 中 (1s 命令 的 基本 实现 部 分 ) 使 用 了 其 中 几 个 函数 。 
头 文件 <airent .h> 中 定义 的 airent 结 构 与 实现 有 关 。 几 种 典型 的 UNIX 实 现 对 此 结构 所 
作 的 定义 至 少 包含 下 列 两 个 成 员 : 
struct dirent { 
ino t d ino; /* i-node number */ 


char d name[NAME MAX + 1]; /* null-terminated filename */ 


} 


POSIX.1 并 没有 定义 d_ino， 因 为 这 是 一 个 实现 特征， 但 在 POSIX.1 的 XSI 扩 展 中 定义 了 d_ino。 
POSIX.1 在 此 结构 中 只 定义 了 d_name 项 。 


注意 ，Solaris 没 有 将 NAME_MAX 定 义 为 一 个 常量 一 一 其 值 依 赖 于 该 目录 所 在 的 文件 系统 ， 
并 且 通 常 可 用 fpathconf 函 数 取 得 。NRAME_MAX 的 常用 值 是 235 ( 见 表 2-12)。 因 为 文件 名 是 以 
nul1 字 符 结束 的 ， 所 以 在 头 文件 中 如 何 定义 数组 G_name 并 无 多 大 关系 ， 数 组 大 小 并 不 表示 文 
件 名 的 长 度 。 

DIR 结 构 是 一 个 内 部 结构 ,上 述 6 个 函数 用 这 个 内 部 结构 保存 当前 正 被 读 的 目录 的 有 关 信 息 。 
其 作用 类 似 于 FILE 结 构 。FILE 结 构 由 标准 VO 库 维 护 (我 们 将 在 第 5 章 中 对 它 进行 说 明 )。 

由 opendir 返 回 的 指向 DIR 结 构 的 指针 由 另外 5 个 函数 使 用 。opendir 执 行 初始 化 操作 ， 
使 第 一 个 readdir 读 目录 中 的 第 一 个 目录 项 。 目 录 中 各 目录 项 的 顺序 与 实现 有 关 。 它 们 通常 并 
不 按 字母 顺序 排列 。 


实例 

我 们 将 使 用 这 些 对 目录 进行 操作 的 例 程 编写 一 个 遍历 文件 层次 结构 的 程序 ， 其 目的 是 得 到 
如 表 4-3 中 所 示 的 各 种 类 型 的 文件 数 。 程 序 清单 4-7 中 的 程序 只 有 一 个 参数 ， 它 说 明 起 点 路 径 名 ， 
从 该 点 开始 递归 降序 遍历 文件 层次 结构 。Solaris 提 供 了 一 个 遍历 此 层次 结构 的 函数 ftw(3)， 对 
于 每 一 个 文件 它 都 会 调用 一 个 用 户 定 义 的 函数 。ftw 函 数 的 问题 是 : 对 于 每 一 个 文件 ， 它 都 会 
调用 stat 育 数 ， 这 就 使 程序 跟随 符号 链接 。 例 如 ， 如 果 从 root 开 始 ， 并 且 有 一 个 名 为 /1ib 的 
符号 链接 ， 它 指向 /usr/1ib， 则 所 有 在 目录 /usr/1ib 中 的 文件 都 会 计数 两 次 。 为 了 纠正 这 
一 点 ，Solaris 提 供 了 另 一 个 函数 nftw(3)， 它 具有 一 个 停止 跟随 符号 链接 的 选项 。 尽 管 可 以 使 
用 nftw， 但 是 为 了 说 明 目 东 例 程 的 使 用 方法 ， 我 们 还 是 编写 了 一 个 简单 的 文件 遍历 程序 。 


在 Single UNIX Specification 中 ，ftw 和 nftw 都 包含 在 基本 POSIX.1 标 准 的 XSI 扩 展 中 。Solaris 9 和 
Linux 2.4.22 都 包括 了 它们 的 实现 。 基 于 BSD 的 UNIX 系 统 则 有 另 一 个 函数 fts(3)，、 它 提供 类 似 的 功能 。 
该 函数 在 Free BSD 5.2.1, MAC OS X 10.3 和 Linux 2.4.22 中 是 可 用 的 。 


程序 清单 4-7 ”递归 降序 遍历 目录 层次 结构 ， 并 按 文件 类 型 计数 





#include "apue.h" 
#include «dirent.h» 
#include <limits.h> 


/* function type that is called for each filename */ 
typedef int Myfunc(const char *, const struct stat *, int); 
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static Myfunc myfunc; 
Static int myftw(char *, Myfunc *); 
Static int dopath (Myfunc *); 


static long nreg, ndir, nblk, nchr, nfifo, nslink, nsock, ntot; 
int 
main(int argc, char *argv[]) 


{ 


int ret; 


if (argc != 2) 
err quit("usage: ftw <starting-pathname>") ; 


ret = myftw(argv[1], myfunc); /* does it all */ 


ntot = nreg + ndir + nblk + nchr + nfifo + nslink + nsock; 
if (ntot == 0) 
ntot = 1; /* avoid divide by 0; print 0 for all counts */ 
printf ("regular files = $71d, %5.2f %%\n", nreg, 
nreg*100.0/ntot); 
printf ("directories 
ndir*100.0/ntot); 
printf ("block special = $71d, $5.2f %%\n", nblk, 
nblk*100.0/ntot); 
printf ("char special 
nchr*100.0/ntot); 
printf ("FIFOs 
nfifo*100.0/ntot); 
printf("symbolic links 
nslink*100.0/ntot); 
printf ("sockets 
nSock*100.0/ntot); 


$71d, $5.2f %%\n", ndir, 


$71d, $5.2f %%\n", nchr, 


$71d, $5.2f %%\n", nfifo, 


$71d, $5.2f %%\n", nslink, 


$71d, %5.2£ %%\n", nsock, 


exit (ret); 


} 
/* 


* Descend through the hierarchy, starting at "pathname". 
* The caller's func() is called for every file. 


*/ 
#define FTW F 1 /* file other than directory */ 
#define FTWD 2 /* directory */ 
#define FTW_DNR 3 /* directory that can’t be read */ 
#define FTW NS 4 /* file that we can't stat */ 
Static char *fullpath; /* contains full pathname for every file */ 
static int /* we return whatever func() returns */ 


myftw(char *pathname, Myfunc *func) 


int len; 

fullpath - path alloc(&len); /* malloc's for PATH MAX«1 bytes */ 
/* (Figure 2.15) */ 

strncpy(fullpath, pathname, len); /* protect against */ 

fullpath[len-1] = 0; /* buffer overrun */ 


return (dopath (func) }; 


} 


/* 
* Descend through the hierarchy, starting at "fullpath". 
* If "fullpath" is anything other than a directory, we lstat() it, 
* call func(), and return. For a directory, we call ourself 
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* recursively for each name in the directory. 

*/ 
Static int /* we return whatever func() returns */ 
dopath(Myfunc* func): 


{ 


struct stat statbuf ; 
struct dirent *dirp; 
DIR *dp; 

int ret; 
char *ptr; 


if (1stat(fullpath, &statbuf) « 0) /* stat error */ 
return(func(fullpath, &statbuf, FTW NS)); 
if (S ISDIR(statbuf.st mode) == 0) /* not a directory */ 
return(func(fullpath, &statbuf, FTW F)); 
/* 
* It's a directory. First call func() for the directory, 
* then process each filename in the directory. 
*/ 
if ((ret = func(fullpath, &statbuf, FTW D)) !- 0) 
return (ret); 


ptr = fullpath + strlen(fullpath); /* point to end of fullpath */ 

*ptree = '/'; 

*ptr = 0; 

if ((dp = opendir(fullpath)) == NULL) /* can’t read directory */ 
return(func(fullpath, &statbuf, FTW DNR)); 


while ((dirp = readdir(dp)) != NULL) { 


if (strcmp(dirp-»d name, ".") == 0 || 
stremp(dirp-»d name, "..") == 0) 
continue; /* ignore dot and dot-dot */ 


strcpy(ptr, dirp-»d name); /* append name after slash */ 
if ((ret = dopath(func)) != 0) /* recursive */ 
break; /* time to leave */ 
ptr[-1] = 0; /* erase everything from slash onwards */ 


if (closedir(dp) « 0) 
err ret("can't close directory ts", fullpath); 


return(ret); 


) 


Static int 
myfunc (const char *pathname, const struct stat *statptr, int type) 


switch (type) ( 


case FTW F: 
switch (statptr-»5t mode & S IFMT) { 
case S IFREG: nreg++; break; 
case S IFBLK: nblk++; break; 
case S IFCHR: nehr++; break; 
case S_IFIFO: nfifo++; break; 
case S IFLNK: nslink++; break; 
case S IFSOCK: nsock++; break; 


case S IFDIR: 
err dump ("for S IFDIR for $8", pathname); 
/* directories should have type - FTW D */ 
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break; 


case FTW D: 
ndir++; 
break; 


case FTW DNR: 
err ret ("can’t read directory $s", pathname); 
break; 


case FTW_NS: 
err_ret ("stat error for %s", pathname) ; 
break; 


default: 
err_dump("unknown type %d for pathname $s", type, pathname) ; 
} 


return (0) ; 


} 





在 程序 中 ， 我 们 提供 了 比 所 要 求 的 更 多 的 通用 性 ， 这 样 做 的 目的 是 为 了 具体 说 明 ftw 函 数 
的 应 用 。 例 如 ， 函 数 myfunc 总 是 返回 0， 即 使 调用 它 的 函数 准备 处 理 非 0 返回 也 是 如 此 。 oO 


关于 降序 遍历 文件 系统 的 更 多 信息 ， 以 及 在 很 多 标准 UNIX 命 令 (如 finda、1s、tar 等 ) 
中 使 用 这 种 技术 的 情况 ， 请 参阅 Fowler、Korn 和 Vo[1989]. 


4.22 chdir、fchdir 和 getcwd 函 数 


每 个 进程 都 有 一 个 当前 工作 目录 ， 此 目录 是 搜索 所 有 相对 路 径 名 的 起 点 (不 以 斜 杠 开始 的 
路 径 名 为 相对 路 径 名 ) 。 当 用 户 登录 到 UNIX 系 统 时 ， 其 当前 工作 目录 通常 是 口令 文件 (/etc/ 
passwd) 中 该 用 户 登 录 项 的 第 6 个 字段 一 一 用 户 的 起 始 目录 (home directory)。 当 前 工作 目录 
是 进程 的 一 个 属性 ， 起 始 目 录 则 是 登录 名 的 一 个 属性 。 

进程 通过 调用 chdir 或 fchair 函 数 可 以 更 改 当前 工作 目录 。 








#include <unistd.h> 
int chdir(const char *pathname) ; 
int fchdir(int filedes) ; 


两 个 函数 的 返回 值 : 若 成 功 则 返回 0， 苦 出 错 则 返回 -1 
在 这 两 个 函数 中 ， 分 别 用 pathname 或 打开 文件 描述 符 来 指定 新 的 当前 工作 目录 。 


fchqir 不 是 基本 POSIX.1 规 范 的 所 属 部 分 ， 在 Single UNIX Specification 中 ， 它 是 XSI 扩 展 部 分 。 
AAT HF SARS HHH, 











x 例 
因为 当前 工作 目录 是 进程 的 一 个 属性 ， 所 以 它 只 影响 调用 chai 的 进程 本 身 ， 而 不 影响 其 


他 进程 (我们 将 在 第 8 章 更 详细 地 说 明 进程 之 间 的 关系 ) 。 这 就 意味 着 程序 清单 4-8 中 的 程序 并 
不 会 产生 我 们 希望 得 到 的 结果 。 
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程序 清单 4-8 chair 函 数 实 例 

#include "apue.h" 
int 
main (void) 

if (chdir("/tmp") < 0) 

err_sys("chdir failed") ; 
printf("chdir to /tmp succeeded\n") ; 
exit(0); 


) 


如 果 编 译 程序 清单 4-8 中 的 程序 ， 并 且 调用 其 可 执行 目标 代码 文件 nycQ， 则 可 以 得 到 下 列 
结果 : 


$ pwd 

/usr/lib 

$ mycd 

chdir to /tmp succeeded 


$ pwd 
/usr/lib 


从 中 可 以 看 出 ， 执 行 mycq 程 序 的 shell 的 当前 工作 目录 并 没有 改变 ， 其 原因 是 shell 创 建 了 一 个 子 
进程 ， 由 该 子 进程 具体 执行 mycq 程 序 。 由 此 可 见 ， 为 了 改变 shell 进 程 自己 的 工作 目录 ，shel 应 
当 直 接 调 用 chdir 函 数 ， 为 此 cd 命令 的 执行 程序 直接 包含 在 shell 程 序 中 。 E 


因为 内 核 保 持 有 当前 工作 目录 的 信息 ， 所 以 我 们 应 能 取 其 当前 值 。 不 幸 的 是 ， 内 核 为 每 个 
进程 只 保存 指向 该 目录 v 节 点 的 指针 等 目录 本 身 的 信息 ， 并 不 保存 该 目录 的 完整 路 径 名 。 

我 们 需要 一 个 函数 ， 它 从 当前 工作 目录 ARM) 开始 ， 用 .. 目 录 项 找到 其 上 一 级 的 目录 ， 
然后 读 其 目录 项 ， 直 到 该 目录 项 中 的 i 节点 编号 与 工作 目录 i 节点 编号 相同 ， 这 样 就 找到 了 其 对 
应 的 文件 名 。 按 照 这 种 方法 ， 逐 层 上 移 ， 直 到 直到 根 ， 这 样 就 得 到 了 当前 工作 目录 完整 的 绝对 
路 径 名 。 很 幸运 ， 函 数 getcwa 就 提供 了 这 种 功能 。 





#include <unistd.h> 


char *getcwd(char *buf, size t size); 





返回 值 : 车 成 功 则 返回 bxf， 若 出 错 则 返回 NULL 


向 此 函数 传递 两 个 参数 ， 一 个 是 缓冲 地 址 puf， 另 一 个 是 缓冲 的 长 度 size (单位 : 字 节 )。 该 
缓冲 必须 有 足够 的 长 度 以 容纳 绝对 路 径 名 再 加 上 一 个 nul1 终 止 字符 ， 和 否则 返回 出 错 (请 回忆 
2.5.5 市 中 有 关 为 最 大 长 度 路 径 名 分 配 空间 的 讨论 )。 


某 些 getcwd 的 早期 实现 允许 第 一 个 参数 buf 为 NULL。 在 这 种 情况 下 ， 此 函数 调用 malloc 动 态 地 分 
配 size 字 节 数 的 空间 。 这 不 是 POSIX.1 或 Single UNIX Specification 的 所 属 部 分 ， 应 当 避 免 使 用 ， 


程序 清单 4.9 中 的 程序 将 工作 目录 更 改 至 一 个 指定 的 目录 ， 然 后 调用 getcwa， 最 后 打印 访 
工作 目录 。 如 果 运 行 该 程序 ， 则 可 得 


$ ./a.out 
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cwd = /var/spool/uucppublic 
$ ls -1 /usr/spool 
lrwxrwxrwx 1 root 12 Jan 31 07:57 /usr/spool -» ../var/spool 


程序 清单 4-9 getcwd 函 数 实 例 
#include "apue.h" 


int 
main (void) 


char *ptr; 
int size; 


if (chdir("/usr/spool/uucppublic") « 0) 
err sys("chdir failed"); 


ptr - path alloc(&size); /* our own function */ 
if (getcwd(ptr, size) -- NULL) 
err sys("getcwd failed"); 


printf ("cwd = $sWMn", ptr); 
exit (0); 


} 





注意 ，chdir 跟 随 符 号 链接 (WA49P MR), [eX Ygetcwdit E RA E SIR SL /var/spool 8 
录 时 ， 它 并 不 了 解 该 目录 由 符号 链接 /usr/spool 所 指向 。 这 是 符号 链接 的 一 种 特性 


E 
当 一 个 应 用 程序 需要 在 文件 系统 中 返回 到 其 工作 的 起 点 时 ，getcwd 函 数 是 有 用 的 。 在 更 
换 工 作 目 录 之 前 ， 我 们 可 以 调用 getcwa 函 数 先 将 其 保存 起 来 。 在 完成 了 处 理 后 ， 就 可 将 从 
getcwa 获 得 的 路 径 名 作为 调用 参数 传送 给 chdir， 这 样 就 返回 到 了 文件 系统 中 的 起 点 。 
fchair 函 数 向 我 们 提供 了 一 种 完成 此 任务 的 便捷 方法 。 在 更 换 到 文件 系统 中 的 不 同位 置 
前 ， 无 需 调 用 getcwd 函 数 ， 而 是 使 用 open 打 开 当 前 工作 目录 ， 然 后 保存 文件 描述 符 。 当 希望 
回 到 原 工作 目录 时 ， 只 要 简单 地 将 该 文件 描述 符 传递 给 fchair。 


4.23 设备 特殊 文件 


st_dqev 和 st_rdev 这 两 个 字段 经 常 引起 混淆 ， 在 18.9 节 编写 [tyname 函 数 时 ， 需 要 使 用 
这 两 个 字段 。 有 关 规 则 很 简单 : 

“每 个 文件 系统 所 在 的 存储 设备 都 由 其 主 、 次 设备 号 表示 。 设 备 号 所 用 的 数据 类 型 是 基本 
系统 数据 类 型 Qev_t 。 主 设备 号 标识 设备 驱动 程序 ， 有 了 时 编码 为 与 其 通信 和 的 外 设 板 ， 次 
设备 号 标识 特定 的 子 设备 。 回 忆 图 4-1， 磁 盘 驱 动 器 经 常 包含 若干 个 文件 系统 。 在 同一 磁 
盘 驱 动 器 上 的 各 文件 系统 通常 具有 相同 的 主 设备 号 ， 但 它们 的 次 设备 号 却 不 同 。 

“我 们 通常 可 以 使 用 两 个 宏 即 maj or 和 minor 来 访问 主 、 次 设备 号 ， 大 多 数 实现 都 定义 了 
这 两 个 宏 。 这 就 意味 着 我 们 无 需 关 心 这 两 个 数 是 如 何 存放 在 dev_t 对 象 中 的 。 


早期 的 系统 用 16 位 整 型 存放 设备 号 : 8 位 用 于 主 设备 号 ，8 位 用 于 次 设备 号 。FreeBSD 5.2.1 和 Mac 
OS X 10.3 使 用 32 位 整 型 ， 其 中 8 位 表示 主 设 备 号 ，24 位 表示 次 设备 号 。 在 32 位 系统 上 ，Solaris 9 用 32 位 
整 型 表示 dev_ 上， 其 中 14 位 用 于 主 设备 号 ，18 位 用 于 次 设备 号 。 在 64 位 系统 上 ，Solaris 9 用 64 位 整 型 数 
表示 dev 上， 各 用 其 中 的 32 位 表示 主 设 备 号 和 次 设备 号 。 在 Linux 24.224, £&/Adev 上 是 64 位 整 型 ， 
但 目前 其 主 设 备 号 和 次 设备 号 还 只 各 用 8 位 。 
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POSIX.1 说 明 Gev_ 上 类 型 是 存在 的 ， 但 没有 定义 它 包 含 什 么 ， 或 如 何 取得 其 内 容 。 大 多 数 实 现 定义 
了 宏 major 和 minor ， 但 在 哪 一 个 头 文件 中 定义 它们 则 与 实现 有 关 。 基 于 BSD 的 UNIX 系 统 将 它们 定义 
£&«sys/types» Ty; Solaris 将 它们 定义 在 <sys/mkdev.h> 中 ; Linuxdt X 1] z 3t 
<Sys/sysmacros.h> 中 ， 而 该 头 文 件 又 包括 在 <sys/type.h> 中 。 


* 系统 中 与 每 个 文件 名 关联 的 st_dev 值 是 文件 系统 的 设备 号 ， 该 文件 系统 包含 了 这 一 文件 
名 以 及 与 其 对 应 的 i 节点 。 
。 只 有 字符 特殊 文件 和 块 特殊 文件 才 有 st_rdev 值 。 此 值 包含 实际 设备 的 设备 号 。 


程序 清单 4-10 中 的 程序 为 每 个 命令 行 参数 打印 设备 号 ， 另 外 ， 若 此 参数 引用 的 是 字符 特殊 
文件 或 块 特殊 文件 ， 则 还 会 打印 该 特殊 文件 的 st_raev 值 。 


程序 清单 4-10 打印 st_dev 和 st_rdev 值 


#include "apue.h" 
#ifdef SOLARIS 
#include <sys/mkdev.h> 
#endif 


int 
main(int argc, char *argv(]l) 


int 1; 
struct stat buf; 


for (i = 1; i « argc; i++) { 
printf("$s: ", argv(il); 
if (stat (argv[i], &buf) < 0) { 
err ret("stat error"); 


continue; 
} 
printf ("dev = %d/%d", major(buf.st dev), minor (buf.st_dev)); 
if (S_ISCHR(buf.st_mode) || S_ISBLK(buf.st_mode)) { 
printf(" (%s) rdev = %d/%d", 
(S ISCHR(buf.st mode)) ? "character" : "block", 


major(buf.st rdev), minor(buf.st rdev)); 


) 


printf ("\n"); 


} 


exit (0); 


运行 此 程序 得 到 下 面 的 结果 : 

$ ./a.out / /home/sar /dev/tty[01] 
/: dev = 3/3 
/home/sar: dev 
/dev/ttyO: dev 0/7 (character) rdev - 4/0 
/dev/tty1: dev 0/7 (character) rdev - 4/1 
$ mount 哪些 日 录 安 装 在 哪些 设备 上 ? 
/dev/hda3 on / type ext2 (rw,noatime) 

/dev/hda4 on /home type ext2 (rw,noatime) 


3/4 
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$ 1s -1L /dev/tty[01] /dev/hda[34] 


brw------- 1 root 3, 3 Dec 31 1969 /dev/hda3 
brw------- 1 root 3 4 Dec 31 1969 /dev/hda4 
Crw------- 1 root 4, 0 Dec 31 1969 /dev/tty0 
Crw------- 1 root 4 1 Jan 18 15:36 /dev/ttyl 


传递 给 该 程序 的 前 两 个 参数 是 目录 (/ 和 /home/sar)， 后 两 个 是 设备 名 /dev/tty[01] 。( 我 
们 用 shell 正 则 表达 式 语言 以 缩短 设备 名 。shell 将 扩展 该 字符 串 /dev/tty[01] 为 /daev/ 
tty0/dev/tty1,) 

这 两 个 设备 是 字符 特殊 设备 。 从 程序 的 输出 可 见 ， 根 目录 和 /home/sar 目 录 的 设备 号 不 
同 ， 这 表示 它们 位 于 不 同 的 文件 系统 中 。 运 行 hount(]) 命 令 证 明了 这 一 点 。 

然后 用 1s 命 令 查看 由 mount 命 令 报告 的 两 个 磁盘 设备 和 两 个 终端 设备 。 这 两 个 磁盘 设备 是 
块 特殊 文件 ， 而 两 个 终端 设备 则 是 字符 特殊 文件 。( 通 常 ， 只 有 块 特殊 文件 类 型 的 设备 才能 包 
含 随机 访问 文件 系统 ， 它 们 是 : 硬盘 驱动 器 、 软 盘 驱 动 器 和 CD-ROM 等 。UNIX 的 早期 版 本 支 
持 磁 带 存 放 文 件 系 统 ， 但 这 从 未 广泛 使 用 过 ,。) 

注意 ， 两 个 终端 设备 (st_dev) 的 文件 名 和 i 节点 在 设备 0/7 上 (devfs 伪 文件 系统 ， 它 实 
现 了 /daev 文 件 系 统 ) ， 但 是 它们 的 实际 设备 号 是 440 和 4/1。 口 


4.24 文件 访问 权限 位 小 结 


我 们 已 经 说 明了 所 有 文件 访问 权限 位 ， 其 中 某 些 位 有 多 种 用 途 。 表 4-12 列 出 了 所 有 这 些 权 
限 位 ， 以 及 它们 对 普通 文件 和 目录 文件 的 作用 。 


表 4-12 文件 访问 权限 位 小 结 


[rx us | | | 




















S ISUID | 设置 用 户 ID | 执行 时 设置 有 效用 PiD | | Em | 
S ISGID | 设置 组 ID 若 组 执行 位 设置 ， 则 执行 时 设置 有 效 组 ID ， 将 在 目录 中 创建 的 新 文件 的 组 ID 设 
EN (Ett) 置 为 目录 的 组 ID 


交换 区 保存 程序 正文 Gk) 限制 在 目录 中 删除 和 更 名 文件 
































S_IRUSR FT aoe 许可 用 户 读 目录 项 

S_IWUSR | APS 许可 用 户 写 文件 许可 用 户 在 目录 中 删除 和 创建 文件 
S IXUSR | 用 户 执行 许可 用 户 执行 文件 许可 用 户 在 目录 中 搜索 给 定 路 径 名 
S_IRGRP | 组 读 许可 组 读 文 件 许可 组 读 目录 项 

S IWGRP | 组 写 许可 组 写 文件 许可 组 在 目录 中 删除 和 创建 文件 






S_IXGRP | 组 执行 许可 组 执行 文件 许可 组 在 目录 中 搜索 给 定 路 径 名 
S_IROTH | 其 他 读 许可 其 他 读 文 件 VF a] bik B R 

S IWOTH | 其 他 写 许可 其 他 写 文件 许可 其 他 在 目录 中 删除 和 创建 文件 
S_IXOTH | 其 他 执行 许可 其 他 执行 文件 许可 其 他 在 目录 中 搜索 给 定 路 径 名 


最 后 9 个 常量 分 成 3 组 ， 因 为 


S_IRWXU = S_IRUSR | S_IWUSR | S_IXUSR 
S IRWXG = S IRGRP | S IWGRP | S IXGRP 
S IRWXO - S IROTH | S IWOTH | S IXOTH 


4.25 ”小结 
本 章 内 容 围绕 stat 函 数 ， 详 细 介绍 了 stat 结 构 中 的 每 一 个 成 员 。 这 使 我 们 对 UNIX 文 件 的 
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各 个 属性 都 有 所 了 解 。 对 文件 的 所 有 属性 以 及 操作 文件 的 所 有 函数 有 完整 的 了 解 对 UNIX 编 程 
是 非常 重要 的 。 
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用 stat 函 数 替换 程序 清单 4-1 中 的 1stat 函 数 ， 如 车 命 令 行 参数 之 一 是 符号 链接 ， 那 么 
会 发 生 什 么 变化 。 

如 果 文 件 模式 创建 屏 项 字 是 777 (八进制 )， 结 果 会 怎样 7 用 shel 的 uma sk 命令 验证 该 结果 。 
关闭 一 个 你 所 拥有 文件 的 用 户 读 权 限 ， 将 导致 不 允许 你 访问 自己 的 文件 ， 对 此 进行 验证 。 
创建 文件 foo 和 ibar 后 ， 运 行程 序 清单 4-3 中 的 程序 ， 这 将 发 生 什么 情况 ? 

4.12 节 中 讲 到 一 个 普通 文件 的 大 小 可 以 为 0， 同 时 我 们 又 知道 st_size 字 段 是 为 目录 或 符 
号 链接 定义 的 ， 那 么 目录 和 符号 链接 的 长 度 是 否 可 以 为 0? 

编写 一 个 类 似 cp(1) 的 程序 ， 它 复制 包含 空洞 的 文件 ， 但 不 将 字 节 0 写 到 输出 文件 中 去 。 
在 4.12 节 1 s 命 令 的 输出 中 ，core 和 core .copy 的 访问 权限 不 相同 ， 如 果 创 建 两 个 文件 
时 umask 没 有 变 ， 说 明 为 什么 会 产生 这 种 差别 。 

在 运行 程序 清单 4-5 中 的 程序 时 ， 使 用 了 qt(1D) 命 令 来 检查 空闲 的 磁盘 空间 。 为 什么 不 使 用 
du(1)ar4? 

3&4- 101r ERU ink AS f OC CHER ee REIR], ERAN? 

4.21 节 中 ， 系 统 对 可 打开 文件 数 的 限制 对 myftw 函 数 会 产生 什么 影响 ? 

4.21 节 中 的 myftw 从 不 改变 其 目录 ， 对 这 种 处 理 方法 进行 改动 : 每 次 遇 到 一 个 目录 就 用 其 
调用 chair， 这 样 每 次 调用 1 stat 时 就 可 以 使 用 文件 名 而 非 路 径 名 ， 处 理 完 所 有 的 目录 
项 后 执行 chdir ("..")。 比 较 这 种 版 本 的 程序 和 正文 中 程序 的 运行 时 间 。 

每 个 进程 都 有 一 个 根 目 录用 于 解析 绝对 路 径 名 ， 可 以 通过 chroot 函 数 改 变 根 目录 。 在 手 
册 中 查阅 此 函数 ， 说 明 这 个 函数 什么 时 候 有 用 。 

如 何 使 用 utime 函 数 只 设置 两 个 时 间 值 中 的 一 个 ? 

有 些 版 本 的 finger(1) 命 令 输出 “New mail received...” $p” unread since...”， 其 中 ... 表 示 
相应 的 日 期 和 时 间 。 程 序 是 如 何 决定 这 些 日 期 和 时 间 的 ? 

用 cpio(1) 和 tar(1) 命 令 检查 档案 文件 的 格式 (请 参阅 UNIX Programmer’s Manual 第 5 节 
中 的 说 明 )。 三 个 时 间 值 中 哪 几 个 是 为 每 一 个 文件 保存 的 ? 文件 复原 时 ， 文 件 访问 时 间 是 
什么 ?为 什么 ? 

UNIX 对 目录 的 深度 有 限制 吗 ? 编写 一 个 程序 循环 ， 在 每 次 循环 中 ， 创 建 目 录 ， 并 将 该 目 
录 更 改 为 工作 目录 。 确 保 叶 节点 的 绝对 路 径 名 的 长 度 大 于 系统 的 PATH_MAX 限 制 。 可 以 
调用 getcwd 得 到 目录 的 路 径 名 吗 ? 标准 UNIX 工 具 是 如 何 处 理 长 路 径 名 的 ? 对 目录 可 以 
使 用 az 或 cpio 命 令 归 档 目 录 吗 ? 

3.16 节 中 描述 了 /dev/fa 特 征 ， 如 果 每 个 用 户 都 可 以 访问 这 些 文件 ， 则 其 访 间 权 限 必须 
为 rw-rw-rw-。 有 些 程序 创建 输出 文件 时 ， 先 删除 该 文件 以 确保 该 文件 名 不 存在 。 


unlink (path) ; 
if ((fd = creat (path, FILE MODE)) < 0) 
err_sys(...); 


讨论 一 下 path 是 /dev/f9/1 的 情况 。 
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第 5 章 
标准 IO 库 





5.1 引言 


本 章 说 明 标准 WO 库 。 因 为 不 仅 在 UNIX 上 ， 而 且 在 很 多 操作 系统 上 都 实现 了 此 库 ， 所 以 它 
由 ISO C 标 准 说 明 。Single UNIX Specification 对 ISO C 标 准 进行 了 扩展 ， 定 义 了 另外 一 些 接口 。 

标准 WO 库 处 理 很 多 细节 ， 例 如 缓冲 区 分 配 ， 以 优化 长 度 执行 WO 和 等。 这些 处 理 使 用 户 不 必 
担心 如 何 选择 使 用 正确 的 块 长 度 ( 如 3.9 节 中 所 述 )。 这 使 得 它 便 于 用 户 使 用 ， 但 是 如 果 不 较 深 
入 地 了 解 UO 库 函数 的 操作 ， 也 会 带 来 一 些 问题 。 


标准 IO 库 是 由 Dennis Ritchie 在 1975 年 左右 编写 的 。 它 是 由 Mike Lesk 编 写 的 可 移植 UO 库 的 主要 修 
改版 本 。 令 人 惊讶 的 是 ， 经 过 30 年 后 ， 对 标准 UO 库 只 做 了 极 小 的 修改 。 


5.2 流 和 FILE 对 象 


在 第 3 章 中 ， 所 有 LO 函数 都 是 针对 文件 描述 符 的 。 当 打开 一 个 文件 时 ， 即 返回 一 个 文件 描 
述 符 ， 然 后 该 文件 描述 符 就 用 于 后 续 的 IO 操作 。 而 对 于 标准 MO 库 ， 它 们 的 操作 则 是 围绕 流 
(stream) 进行 的 (请 勿 将 标准 UO 术语 流 与 系统 V 的 STREAMS ORARE, STREAM VOR 
统 是 系统 V 的 组 成 部 分 ，Single UNIX Specification 则 将 其 标准 化 为 XSI STREAM 选 项 ) 。 当 用 标 
准 VO 库 打开 或 创建 一 个 文件 时 ， 我 们 已 使 一 个 流 与 一 个 文件 相关 联 。 

对 于 ASCII 字 符 集 ， 一 个 字符 用 -- 个 字 节 表示 。 对 于 国际 字符 集 ， 一 个 字符 可 用 多 个 字 节 
表示 。 标 准 LO 文 件 流 可 用 于 单字 节 或 多 字 节 CT) 字符 集 。 流 的 定向 (streram's orientation) 
决定 了 所 读 、 写 的 字符 是 单字 节 还 是 多 字 节 的 。 当 一 个 流 最 初 被 创建 时 ， 它 并 设 有 定向 。 如 若 
在 未 定向 的 流 上 使 用 一 个 多 字 节 VO 函数 ( 见 <wchar.h>)， 则 将 该 流 的 定向 设置 为 宽 定向 的 。 若 
在 未 定向 的 流 上 使 用 一 个 单字 节 LO 函 数 ， 则 将 该 流 的 定向 设置 为 字 节 定向 的 。 只 有 两 个 函数 可 
改变 流 的 定向 。freopen 函 数 (参见 5.5 节 ) 清除 一 个 流 的 定向 ，fwide 函 数 设 置 流 的 定向 。 


#include <stdio.h> 
#include <wchar.h> 


int fwide(FILE *fp, int mode); 


ENA. BRE REPUB IEE. Ae 
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根据 mode 参 数 的 不 同 值 ，fwide 函 数 执行 不 同 的 工作 : 
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* 如 车 mode 参 数值 为 负 ，fwide 将 试图 使 指定 的 流 是 字 节 定向 的 。 

* 如 车 mode 参 数值 为 正 ，fwi de 将 试图 使 指定 的 流 是 宽 定向 的 。 

* 如若 mode 参 数值 为 0，fwi de 将 不 试图 设置 流 的 定向 ， 但 返回 标识 该 流 定向 的 值 。 

注意 ，fwi de 并 不 改变 已 定向 流 的 定向 。 还 应 注意 的 是 ，fwi de 无 出 错 返 回 。 试 想 如 若 流 
是 无 效 的 ， 那 么 将 发 生 什么 呢 ? 我 们 唯一 可 依靠 的 是 ， 在 调用 fwide 前 先 清 除 errno， 从 
fwide 返 回 时 检查 errno 的 值 。 在 本 书 的 其 余部 分 ， 我 们 只 涉及 字 节 定向 流 。 

当 打 开 一 个 流 时 ， 标 准 1/O 函 数 fopen 返 回 一 个 指向 FILE 对 象 的 指针 。 该 对 象 通常 是 一 个 
结构 ， 它 包含 了 标准 WO 库 为 管理 该 流 所 需要 的 所 有 信息 ， 包 括 : 用 于 实际 1/O 的 文件 描述 符 、 
指向 用 于 该 流 缓 冲 区 的 指针 、 缓 冲 区 的 长 度 、 当 前 在 缓冲 区 中 的 字符 数 以 及 出 错 标志 等 等 。 

应 用 程序 没有 必要 检验 FILE 对 象 。 为 了 引用 一 个 流 ， 需 将 FILE 指 针 作 为 参数 传递 给 每 个 
标准 VO 函数 。 在 整 本 书 中 ， 我 们 称 指向 FILE 对 象 的 指针 (类 型 为 FILE*) 为 文件 指针 。 

在 本 章 中 ， 我 们 在 UNIX 系 统 的 环境 中 ,说明 标准 WO 库 。 正 如 前 述 ， 此 标准 库 已 移植 到 除 
UNIX 以 外 的 很 多 其 他 操作 系统 中 。 但 是 为 了 说 明 该 库 实现 的 一 些 细节 ， 我 们 将 讨论 其 在 UNIX 
系统 上 的 典型 实现 。 


5.3 标准 输入 、 标 准 输出 和 标准 出 错 


对 一 个 进程 预定 义 了 三 个 流 ， 并 且 这 三 个 流 可 以 自动 地 被 进程 使 用 ， 它 们 是 ， 标准 输入 、 
标准 输出 和 标准 出 错 。 这 些 流 引 用 的 文件 与 3.2 节 中 提 到 的 文件 描述 符 STDIN_FILENO、 
STDOUT_FILENO 和 STDERR_FILENO 所 引用 的 文件 相同 。 

这 三 个 标准 VO 流通 过 预定 义 文件 指针 stain、stdout 和 stderr 加 以 引用 。 这 三 个 文件 
指针 同样 定义 在 头 文件 -staio zh ——— 


5.4 缓冲 


示 准 VO 库 提供 缓冲 的 目的 是 尽 可 能 减少 使 用 read 和 write 调 用 的 次 数 ( 见 表 3-2， 其 中 显 
示 了 在 不 同 缓冲 区 长 度 情况 下 ， 为 执行 O 所 需 的 CPU 时 间 量 ) 。 它 也 对 每 个 IO 流 自动 地 进行 组 
冲 管理 ， 从 而 避免 了 应 用 程序 需要 考虑 这 一 点 所 带 来 的 麻烦 。 不 幸 的 是 ， 标 准 1O 库 最 令 人 迷惑 
的 也 是 它 的 缓冲 。 

标准 IO 提供 了 三 种 类 型 的 缓冲 ， 

(1) 全 缓冲 。 这 种 情况 下 ， 在 填 满 标准 MO 缓冲 区 后 才 进 行 实际 IO 操作 。 对 于 驻 留 在 磁盘 上 
的 文件 通常 是 由 标准 MO 库 实施 全 缓冲 的 。 在 一 个 流 上 执行 第 一 次 IO 操作 时 ， 相 关 标准 MO 函数 
通常 调用 malloc ( 见 7.8 节 ) 获得 需 使 用 的 缓冲 区 。 

术语 冲洗 (flush) 说 明 标 准 VO 缓 冲 区 的 写 操作 。 缓 冲 区 可 由 标准 VO 例 程 自 动 冲洗 (例如 
当 填 满 一 个 缓冲 区 时 ) ， 或 者 可 以 调用 函数 fflush 冲 洗 一 个 流 。 值 得 引起 注意 的 是 在 UNIX 环 
境 中 ，f1lush 有 两 种 意思 。 在 标准 WO 库 方面 ，flush (冲洗 ) 意味 着 将 缓冲 区 中 的 内 容 写 到 磁 
盘 上 (该 缓冲 区 可 能 只 是 局 部 填写 的 ) 。 在 终端 驱动 程序 方面 (例如 第 18 章 中 所 述 的 tcflush 
函数 ) flush (ME) 表示 丢弃 已 存储 在 缓冲 区 中 的 数据 。 

(2) 行 缓冲 。 在 这 种 情况 下 ， 当 在 输入 和 输出 中 遇 到 换行 符 时 ， 标 准 IO 库 执行 1O 操 作 。 这 
允许 我 们 一 次 输出 一 个 字符 (用 标准 WO fputc 函 数 )， 但 只 有 在 写 了 一 行 之 后 才 进 行 实际 1/O 
操作 。 当 流 涉及 一 个 终端 时 (例如 标准 输入 和 标准 输出 )， 通 常 使 用 行 缓冲 。 
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对 于 行 缓冲 有 两 个 限制 。 第 一 ， 因 为 标准 MO 库 用 来 收集 每 - pq eee 
所 以 只 要 填 满 了 缓冲 区 ， 那 么 即使 还 没有 写 一 个 换行 符 ， 也 进行 IO 操作 。 第 二 ， 任 何 时 候 只 
通过 标准 VO 库 要 求 从 (a) 一 个 不 带 缓冲 的 流 ， 或 者 (b) 一 个 行 缓冲 的 流 ( 它 要 求 从 内 核 得 AM 135 
得 到 输入 数据 ， 那 么 就 会 造成 冲洗 所 有 行 缓冲 输出 流 。 在 (b) 中 带 了 一 个 在 括号 中 的 说 明 ， 其 理 
由 是 ， 所 需 的 数据 可 能 已 在 该 缓冲 区 中 ， 它 并 不 要 求 在 需要 数据 时 才 从 内 核 读 数据 。 很 明显 ， 
从 不 带 缓冲 的 一 个 流 中 进行 输入 〈(a) 项 ) 要 求 当时 从 内 核 得 到 数据 。 

(3) 不 带 缓冲 。 标 准 VO 库 不 对 字符 进行 缓冲 存储 。 例 如 ， 如 果 用 标准 VO 函数 fputs 写 15 个 
字符 到 不 带 缓冲 的 流 中 ， 则 该 函数 很 可 能 用 3.8 节 的 write 系 统 调用 函数 将 这 些 字符 立即 写 至 相 
关联 的 打开 文件 上 。 

标准 出 错 流 stderr 通 常 是 不 带 缓冲 的 ， 这 就 使 得 出 错 信息 可 以 尽快 显示 出 来 ， 而 不 管 它 
们 是 否 含有 一 个 换行 符 。 

ISO C 要 求 下 列 缓冲 特征 : 

* 当 且 仅 当 标准 输入 和 标准 输出 并 不 涉及 交互 式 设备 时 ， 它 们 才 是 全 缓冲 的 。 

“标准 出 错 决 不 会 是 全 缓冲 的 。 

但 是 ， 这 并 没有 告诉 我 们 如 果 标 准 输 入 和 输出 涉及 交互 式 设备 时 ， 它 们 是 不 带 缓冲 的 还 是 
行 缓冲 的 ， 以 及 标准 出 错 是 不 带 缓冲 的 还 是 行 缓冲 的 。 很 多 系统 默认 使 用 下 列 类 型 的 缓冲 : 

“标准 出 错 是 不 带 缓冲 的 。 

“如 若是 涉及 终端 设备 的 其 他 流 ， 则 它们 是 行 缓冲 的 ， 否 则 是 全 缓冲 的 。 


本 书 讨论 的 四 种 平台 都 遵从 标准 MO 缓冲 的 这 些 惯 例 ， 标 准 出 错 是 不 带 缓冲 的 ， 打 开 至 终端 设备 
ARATE Hs 其 他 所 有 流 则 是 全 缓冲 的 。 


v adt 5. EUER RARA AEA 


的 一 个 更 改组 六 并 型 ， 


#include <stdio.h> 
void setbuf (FILE *restrict fp, char *restrict buf); 


int setvbuf (FILE *restrict fp, char *restrict buf, int mode, 
size t size); 


返回 值 : 若 成 功 则 返回 0， 若 出 错 则 返回 非 0 值 


这 些 函数 一 定 要 在 流 已 被 打开 后 调用 (这 是 十 分 明显 的 ， 因 为 每 个 函数 都 要 求 一 个 有 效 的 文件 
间 针 作为 它 的 第 一 个 参数 ) ， 而 且 也 应 该 在 对 该 流 执行 任何 一 个 其 他 操作 之 前 调用 。 136 
可 以 使 用 setbuf 函 数 打开 或 关闭 缓冲 机 制 。 为 了 带 缓冲 进行 /JO， 参 数 buf 必 须 指 向 一 个 长 
度 为 BUFSIZ 的 缓冲 区 (该 常量 定义 在 <stdio.h> 中 )。 通 常 在 此 之 后 该 流 就 是 全 缓冲 的 ， 但 
是 如 果 该 流 与 一 个 终端 设备 相关 ， 那 么 某 些 系统 也 可 将 其 设置 为 行 缓冲 。 为 了 关闭 缓冲 ， 将 bu 
设置 为 NULL。 
使 用 setvbuf， 我 们 可 以 精确 地 指定 所 需 的 缓冲 类 型 。 这 是 用 mode 参 数 实现 的 
.IOFBF 全 缓冲 
.IOLBF 行 缓冲 
_IONBF 不 带 缓冲 
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如 果 指 定 一 个 不 带 缓冲 的 流 ， 则 忽略 buf 和 size 参数 。 如 果 指 定 全 缓冲 或 行 缓冲 ， 则 buf 和 
size 可 选择 地 指定 一 个 缓冲 区 及 其 长 度 。 如 果 该 流 是 带 缓冲 的 ， 而 pur 是 NULL， 则 标准 MO 库 将 
自动 地 为 该 流 分 配 适 当 长 度 的 缓冲 区 。 适 当 长 度 指 的 是 由 常量 BUFSIZ 所 指定 的 值 。 


某 些 C 函 数 库 实现 使 用 stat 结 构 中 的 成 员 st_blksize 所 指定 的 值 (24.27) RRENO + E 
长 度 。 在 本 章 的 后 续 内 容 中 可 以 看 到 ，GNU C 函 数 库 就 使 用 这 种 方法 . 


表 5-1 列 出 了 这 两 个 函数 的 动作 ， 以 及 它们 的 各 个 选项 。 


表 5-1 setbuf#lsetvbuf HA 


oo 












合适 长 度 的 系统 缓冲 区 
(忽略 ) | (无 缓 中 区 ) 


要 了 解 ， 如 果 在 一 个 函数 内 分 配 一 个 自动 变量 类 的 标准 MO 缓冲 区 ， 则 从 该 函数 返回 之 前 ， 
必须 关闭 该 流 (7.8 节 将 对 此 作 更 多 讨论 )。 另 外 ， 有 些 实 现 将 缓冲 区 的 一 部 分 用 于 存放 它 自 己 的 
管理 操作 信息 ， 所 以 可 以 存放 在 缓冲 区 中 的 实际 数据 字 节 数 少 于 size。 一 般 而 言 ， 应 由 系统 选择 
缓冲 区 的 长 度 ， 并 自动 分 配 缓冲 区 。 在 这 种 情况 下 关闭 此 流 时 ， 标 准 MO 库 将 自动 释放 缓冲 区 。 

任何 时 候 ， 我 们 都 可 强制 冲洗 一 个 流 。 


#include <stdio.h> 


int fflush(FILE *fp) ; 





返回 值 : 若 成 功 则 返回 8， 车 出 错 则 返回 EOF 


此 函数 使 该 流 所 有 未 写 的 数据 都 被 传送 至 内 核 。 作 为 一 个 特例 ， 如 车 fp 是 NULL， 则 此 函数 将 
导致 所 有 输出 流 被 冲洗 。 


5.5 打开 流 
下 列 三 个 函数 打开 一 个 标准 VO 流 。 








#include <stdio.h> 







FILE *fopen(const char *restrict pathname, const char *restrict type) ; 


FILE *freopen(const char *restrict pathname, const char *restrict type, 
FILE *restrict fp); 


FILE *fdopen(int filedes, const char *fype) ; 


:个 函数 的 返回 值 : 车 成 功 则 返回 文件 指针 ， 若 出 错 则 返回 NULL 





这 三 个 函数 的 区 别 是 : 


bbs.theithome.com 





55 d GF it 113 





(1) fopen 打 开 一 个 指定 的 文件 。 

(2) freopen 在 一 个 指定 的 流 上 打开 一 个 指定 的 文件 ， 如 车 该 流 已 经 打开 ， 则 先 关 闭 该 流 。 
若 该 流 已 经 定向 ， 则 freopen 清 除 该 定向 。 此 函数 一 般 用 于 将 一 个 指定 的 文件 打开 为 一 个 预定 
义 的 流 : 标准 输入 、 标 准 输出 或 标准 出 错 。 

(3) fqaopen 获 取 一 个 现 有 的 文件 描述 符 (我 们 可 能 从 open、dqup、qup2、fcnt1、Pipe、 
socket、socketpaiz 或 accept 国 数 得 到 此 文件 描述 符 ) ， 并 使 一 个 标准 的 MO 流 与 该 描述 符 
相 结 合 。 此 函数 常用 于 由 创建 管道 和 网 络 通信 通道 函数 返回 的 描述 符 。 因 为 这 些 特殊 类 型 的 文 
件 不 能 用 标准 VO fopen 函 数 打 开 ， 所 以 我 们 必须 先 调 用 设备 专用 函数 以 获得 一 个 文件 描述 符 ， 
然后 用 fdopen 使 一 个 标准 LVO 流 与 该 描述 符 相 关联 。 


fopen 和 freopen 是 ISO C 的 所 属 部 分 。 而 ISO C 并 不 涉及 文件 描述 符 ， 所 以 仅 有 POSIX.1 具 有 
fdopen, 


type 参 数 指定 对 该 1O 流 的 读 、 写 方式 ，ISO C 规 定 type 参 数 可 以 有 15 种 不 同 的 值 ， 它 们 示 于 
表 5-2 中 。 


表 5-2 打开 标准 VO 流 的 type 参 数 


rÁ rb 为 读 而 打开 
w 或 wb 把 文件 截 短 至 0 长 ， 或 为 写 而 创建 


a 或 ab 添加 ， 为 在 文件 尾 写 而 打开 ， 或 为 写 而 创建 
上 + 或 +b 或 b+ 为 读 和 写 而 打开 

w+ 或 w+b 或 wb+ 把 文件 截 短 至 0 长 ， 或 为 读 和 写 而 打开 

a+ 或 a+b 或 ab+ 为 在 文件 尾 读 和 写 而 打开 或 创建 


使 用 字符 b 作 为 bype 的 一 部 分 ， 这 使 得 标准 MO 系统 可 以 区 分 文本 文件 和 二 进 制 文件 。 因 为 
UNIX 内 核 并 不 对 这 两 种 文件 进行 区 分 ， 所 以 在 UNIX 系 统 环境 下 指定 字符 b 作 为 ppe 的 一 部 分 实 
际 上 并 无 作用 。 

对 于 fdopen，type 参 数 的 意义 稍 有 区 别 。 因 为 该 描述 符 已 被 打开 ， 所 以 fdopen 为 写 而 打 
开 并 不 截 短 该 文件 。( 例 如 ， 若 该 描述 符 原来 是 由 open 函 数 创 建 的 ， 而 且 该 文件 那 时 已 经 存在 ， 
则 其 0_TRUNC 标 志 将 决定 是 否 截 短 该 文件 。fdopen 函 数 不 能 截 短 它 为 写 而 打开 的 任 一 文件 。) 
另外 ， 标 准 LO 添 写 方 式 也 不 能 用 于 创建 该 文件 (因为 如 车 一 个 描述 符 引 用 一 个 文件 ， 则 该 文件 
一 定 已 经 存在 )。 

当 用 添 写 类 型 打开 一 文件 后 ， 则 每 次 写 都 将 数据 写 到 文件 的 当前 尾 端 处 。 如 若 有 多 个 进程 
用 标准 VO 添 写 方式 打开 了 同一 文件 ， 那 么 来 自 每 个 进程 的 数据 都 将 正确 地 写 到 文件 中 。 


4.4 BSD 以 前 的 伯克利 版 本 以 及 Kernighan 和 Ritchief1988] 177 页 上 所 示 的 莘 单 版 本 中 的 fopen 函 数 
并 不 能 正确 地 处 理 添 写 方 式 。 这 些 版 本 在 打开 流 时 ， 调 用 1seek 定 位 到 文件 尾 端 。 在 涉及 多 个 进程 时 ， 
为 了 正确 地 支持 添 写 方式 ， 该 文件 必须 用 O_RAPPEND 标 志 打开 ， 我 们 已 在 3.3 节 中 对 此 进行 了 讨论 。 在 
每 次 写 前 ， 执 行 一 次 lseek 操 作 同 样 也 不能 正确 工作 (如 同 在 3. 庆 节 中 讨论 的 一 样 )。 


当 以 读 和 写 类 型 打开 一 文件 时 (type 中 + 符号 )， 具 有 下 列 限制 : 
。 如 果 中 间 没 有 fflush、fseek、fsetpos 或 rewind， 则 在 输出 的 后 面 不 能 直接 跟随 输入 。 
。 如 果 中 间 没 有 fseek、fsetpos 或 rewind, 或 者 一 个 输入 操作 没有 到 达 文 件 尾 端 ， 则 
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在 输入 操作 之 后 不 能 直接 跟随 输出 。 
对 应 于 表 5-2， 我 们 在 表 5-3 中 列 出 了 打开 一 个 流 的 6 种 不 同 的 方式 。 


表 5-3 打开 一 个 标准 MO 流 的 6 种 不 同 的 方式 





文件 必须 已 存在 
擦 除 文件 以 前 的 内 容 





流 可 以 读 
we TAS 
流 只 可 在 尾 端 处 写 





注意 ， 在 指定 w 或 a 类 型 创建 一 个 新 文件 时 ， 我 们 无 法 说 明 该 文件 的 访问 权限 位 (第 3 章 中 
所 述 的 open 函 数 和 creat 函数 则 能 做 到 这 一 点 )。 

除非 流 引用 终端 设备 ， 否 则 按 系统 默认 的 情况 ， 流 被 打开 时 是 全 缓冲 的 。 若 流 引 用 终端 设 
备 ， 则 该 流 是 行 缓冲 的 。 一 旦 打开 了 流 ， 那 么 在 对 该 流 执行 任何 操作 之 前 ， 如 果 希 望 ， 则 可 使 
用 上 一 节 所 述 的 setbuf 和 setvbuf 改 变 缓冲 的 类 型 。 

调用 fclose 关 闭 一 个 打开 的 流 。 





#include <stdio.h> 
int fclose(FILE *fp) ; 


返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 EOF 





在 该 文件 被 关闭 之 前 ， 冲 洗 缓冲 区 中 的 输出 数据 。 丢 弃 缓 冲 区 中 的 任何 输入 数据 。 如 果 标 
准 LO 库 已 经 为 该 流 自动 分 配 了 一 个 缓冲 区 ， 则 释放 此 缓冲 区 。 

当 一 个 进程 正常 终止 时 (直接 调用 exit 函 数 ， 或 从 main 函 数 返 回 )， 则 所 有 带 未 写 缓冲 数 
据 的 标准 VO 流 都 会 被 冲洗 ， 所 有 打开 的 标准 1O 流 都 会 被 关闭 。 


5.6 读 和 写 流 


一 旦 打开 了 流 ， 则 可 在 三 种 不 同类 型 的 非 格 式 化 WO 中 进行 选择 ， 对 其 进行 读 、 写 操作 : 

(D 每 次 一 个 字符 的 HO。 一 次 读 或 写 一 个 字符 ， 如 果 流 是 带 缓冲 的 ， 则 标准 WO 函数 会 处 理 
所 有 缓冲 。 

(2) 每 次 一 行 的 JO。 如 果 想 要 一 次 读 或 写 一 行 ， 则 使 用 fgets 和 fputs。 每 行 都 以 一 个 换 
行 符 终止 。 当 调用 fgets 时 ， 应 说 明 能 处 理 的 最 大 行 长 。 5.7 节 将 说 明 这 两 个 函数 。 

(3) 直接 VO。fread 和 fwrite 函 数 支持 这 种 类 型 的 1/O。 每 次 LO 操作 读 或 写 某 种 数量 的 对 
象 ， 而 每 个 对 象 具 有 指定 的 长 度 。 这 两 个 函数 常用 于 从 二 进 制 文件 中 每 次 读 或 写 一 个 结构 。5.9 
节 将 说 明 这 两 个 函数 。 

HAVO (direct VO) 这 个 术语 来 自 ISO CHR, 有 时 也 被 称 为 二 进 制 IO、 一 次 一 个 对 象 UO、 面 
向 记录 的 MO 或 面向 结构 的 IO。 


(5.11 节 说 明了 格式 化 VO 函数 ， 例 如 printf 和 scanf.) 
1. 输入 函数 
以 下 三 个 函数 可 用 于 一 次 读 一 个 字符 。 
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#include <stdio.h> 


int getc(FILE *fp); 


int fgetc(FILE *fp); 
int getchar (void); 


三 个 函数 的 返回 值 ， 若 成 功 则 返回 下 一 个 字符 ， 若 已 到 达 文 件 结尾 或 出 错 则 返回 EOF 


函数 getchar 等 价 于 getc(stdin)。 前 两 个 函数 的 区 别 是 getc 可 被 实现 为 宏 ， 而 fgetc 
则 不 能 实现 为 宕 。 这 意味 着 : 

(1) getc 的 参数 不 应 当 是 具有 副作用 的 表达 式 。 

(2) 因为 fgetc 一 定 是 一 个 函数 ， 所 以 可 以 得 到 其 地 址 。 这 就 允许 将 Egetc 的 地 址 作为 一 
个 参数 传送 给 另 一 个 函数 。 

(3) 调用 fgetc 所 需 时 间 很 可 能 长 于 调用 getc， 因 为 调用 函数 通常 所 需 的 时 间 长 于 调用 宏 。 

这 三 个 函数 在 返回 下 一 个 字符 时 ， 会 将 其 unsigned char 类 型 转换 为 nt 类型。 说 明 为 不 
带 符 号 的 理由 是 ， 如 果 最 高 位 为 1 也 不 会 使 返回 值 为 负 。 要 求 整 型 返回 值 的 理由 是 ， 这 样 就 可 
以 返回 所 有 可 能 的 字符 值 再 加 上 一 个 已 出 错 或 已 到 达 文 件 尾 端的 指示 值 。 在 <staio .h> 中 的 
常量 EOF 被 要 求 是 一 个 负 值 ， 其 值 经 常 是 -1。 这 就 意味 着 不 能 将 这 三 个 函数 的 返回 值 存放 在 一 
个 字符 变量 中 ， 以 后 还 要 将 这 些 函 数 的 返回 值 与 常量 EOF 相 比较 。 

注意 ， 不 管 是 出 错 还 是 到 达 文 件 尾 端 ， 这 三 个 函数 都 返回 同样 的 值 。 为 了 区 分 这 两 种 不 同 
的 情况 ， 必 须 调 用 ferror 或 feof。 





#include <stdio.h> 


int ferror(FILE *fp); 


int feof (FILE *fp); 


两 个 函数 返回 值 : 若 条 件 为 真 则 返回 非 0 值 ( 真 )， 否 则 返回 0 (f) 
void clearerr(FILE *fp); 





在 大 多 数 实现 中 ， 为 每 个 流 在 FILE 对 象 中 维持 了 两 个 标志 : 

* 出 错 标志 。 

。 文 件 结束 标志 。 

调用 clearerr 则 清除 这 两 个 标志 。 

从 流 中 读 取 数据 以 后 ， 可 以 调用 ungetc 将 字符 再 压 送 回流 中 。 


#include <stdio.h> 


int ungetc(int c, FILE *fp); 





返回 值 ， 若 成 功 则 返回 ce， 若 出 错 则 返回 EOF 


压 送 回 到 流 中 的 字符 以 后 又 可 从 流 中 读 出 ， 但 读 出 字符 的 顺序 与 压 送 回 的 顺序 相反 。 应 当 
了 解 ， 虽 然 ISO C 人 允许 实现 支持 任何 次 数 的 回 送 ,但 是 它 要 求实 现 提 供 一 次 只 送 回 一 个 字符 。 
我 们 不 能 期 望 一 次 能 送 回 多 个 字符 。 

回 送 的 字符 不 必 一 定 是 上 一 次 读 到 的 字符 。 不 能 回 送 BOF。 但 是 当 已 经 到 达 文 件 尾 端 时 ， 
仍 可 以 回 送 一 字符 。 下 次 读 将 返回 该 字符 ， 再 次 读 则 返回 BOF。 之 所 以 能 这 样 做 的 原因 是 一 次 
成 功 的 ungetc 调 用 会 清除 该 流 的 文件 结束 标志 。 
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当 正 在 读 一 个 输入 流 ， 并 进行 某 种 形式 的 分 字 或 分 记号 操作 时 ， 会 经 常用 到 回 送 字符 操作 。 

有 时 需要 先 看 一 看 下 一 个 字符 ， 以 决定 如 何 处 理 当 前 字符 。 然 后 就 需要 方便 地 将 刚 查看 的 字符 

141) 送 回 ， 以 便 下 一 次 调用 getc 时 返回 该 字符 。 如 果 标 准 MO 库 不 提供 回 送 能 力 ， 就 需 将 该 字符 存 

放 到 一 个 我 们 自己 的 变量 中 ， 并 设置 一 个 标志 以 便 判 别 在 下 一 次 需要 一 个 字符 时 是 调用 getc， 
还 是 从 我 们 自己 的 变量 中 取 用 。 


用 ungetc 压 送 回 字 符 时 ， 并 没有 将 它们 写 到 文件 中 或 设备 上 ， 只 是 将 它们 写 回 标准 MO 库 的 流 缕 
TEC, 


2. 输出 函数 
对 应 于 上 面 所 述 的 每 个 输入 函数 都 有 一 个 输出 函数 。 


#include <stdio.h> 


int putc(int c, FILE *fp); 


int fputc(int c, FILE *fp); 


int putchar(int c); 


三 个 函数 返回 值 ， 若 成 功 则 返回 c， 若 出 错 则 返回 EOF 





与 输入 国 数 一 样 ，putchar (c) #%&Fputc(c, stdout), putec AAA, ififputc 
则 不 能 实现 为 宏 。 


5.7 每 次 一 行 VO 
下 面 两 个 函数 提供 每 次 输入 一 行 的 功能 。 


#include <stdio.h> 


char *fgets(char *restrict buf, int n, FILE *restrict fp); 


char *gets(char *buf) ; 


两 个 函数 返回 值 ， 若 成 功 则 返回 buf， 若 已 到 达 文 件 结尾 或 出 错 则 返回 NULL 





这 两 个 函数 都 指定 了 缓冲 区 的 地 址 ， 读 入 的 行将 送 入 其 中 。gets 从 标准 输入 读 ， 而 fgets 则 
从 指定 的 流 读 。 

对 于 fgets， 必 须 指定 缓 促 区 的 长 度 n。 此 函数 一 直 读 到 下 一 个 换行 符 为 止 ， 但 是 不 超过 
n 一 1 个 字符 ， 读 入 的 字符 被 送 入 缓冲 区 。 该 缓冲 区 以 null 字 符 结尾 。 如 若 该 行 (包括 最 后 一 个 换 
行 符 ) 的 字符 数 超过 n 一 1, 则 fgets 只 返回 一 个 不 完整 的 行 , 但 是 , 缓冲 区 总 是 以 null 字 符 结尾 。 
对 fgets 的 下 一 次 调用 会 继续 读 该 行 。 

gets 是 一 个 不 推荐 使 用 的 函数 。 其 问题 是 调用 者 在 使 用 gets 时 不 能 指定 缓冲 区 的 长 度 。 
这 样 就 可 能 造成 缓冲 区 溢出 (如 车 该 行 长 于 缓冲 区 长 度 )， 写 到 缓冲 区 之 后 的 存储 空间 中 ， 从 
而 产生 不 可 预料 的 后 果 。 这 种 缺陷 曾 被 利用 ， 造 成 1988 年 的 因特网 蠕虫 事件 。 有 关 说 明 请 见 
1989 年 6 月 发 行 的 Communications of the ACM (vol.32, no0.6)。gets 与 fgets 的 另 一 个 区 别 是 ， 

gets 并 不 将 换行 符 存 人 缓冲 区 中 。 


这 两 个 函数 处 理 换行 符 方 面 的 差别 与 UNIX 系 统 的 演进 有 关 。 早 在 V7 的 手册 (19794) 中 就 说 明 : 
“为 了 向 后 养 容 ，gets 删 除 换行 符 ， 而 fgets 则 保持 换行 符 。? 
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即使 ISO C 要 求实 现 提供 gets ， 但 请 使 用 fgets， 而 不 要 使 用 gets。 
fputs 和 puts 提 供 每 次 输出 一 行 的 功能 。 


#include <stdio.h> 


int fputs(const char *restrict str, FILE *restrict fp); 


int puts(const char *str) ; 


两 个 函数 返回 值 : 若 成 功 则 返回 非 负 值 ， 若 出 错 则 返回 EOF 





函数 fputs 将 一 个 以 null 符 终 止 的 字符 串 写 到 指定 的 流 ， 尾 端的 终止 符 nul 不 写 出 。 注 意 ， 
这 并 不 一 定 是 每 次 输出 一 行 ， 因 为 它 并 不 要 求 在 nul 符 之 前 一 定 是 换行 符 。 通 常 ， 在 null 符 之 前 
是 一 个 换行 符 ， 但 并 不 要 求 总 是 如 此 。 

puts 将 一 个 以 null 符 终止 的 字符 串 写 到 标准 输出 ， 终 止 符 不 写 出 。 但 是 ，Puts 然 后 又 将 
一 个 换行 符 写 到 标准 输出 。 

puts 并 不 像 它 所 对 应 的 gets 那 样 不 安全 。 但 是 我 们 还 是 应 避免 使 用 它 ， 以 免 顷 要 记 住 它 
在 最 后 是 否 添加 了 一 个 换行 符 。 如 果 总 是 使 用 fgets 和 fputs， 那 么 就 会 熟知 在 每 行 终止 处 我 
们 必须 自己 处 理 换行 符 。 


5.8 标准 MO 的 效率 


使 用 上 一 节 所 述 的 函数 ， 我 们 能 对 标准 VO 系统 的 效率 有 所 了 解 。 程 序 清单 5-1 中 的 程序 类 
似 于 程序 清单 3-3 中 的 程序 ， 它 使 用 getc 和 putc 将 标准 输入 复制 到 标准 输出 。 这 两 个 例 程 可 以 
实现 为 宏 。 
程序 清单 5-1 用 getc 和 putc 将 标准 输入 复制 到 标准 输出 
#include "apue.h" 


int 
main (void) 


int e; 
while ((c » getc(stdin)) !- EOF) 
if (putc(c, stdout) == EOF) 


err_sys ("output error"); 


if (ferror (stdin) ) 
err_sys("input error"); 


exit (0); 


} 


可 以 用 fgetc 和 fputc 改 写 该 程序 ， 这 两 个 一 定 是 函数 ， 而 不 是 宏 (我 们 没有 给 出 更 改 源 
代码 的 细节 )。 
最 后 ， 我 们 还 编写 了 一 个 读 、 写 行 的 版 本 ， 见 程序 清单 5-2。 


程序 清单 5-2 用 fgets 和 fputs 将 标准 输入 复制 到 标准 输出 
#include "apue.h" 


int 
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main (void) 
char buf [MAXLINE] ; 


while (fgets (buf, MAXLINE, stdin) !- NULL) 
if (fputs(buf, stdout) == EOF) 
err sys ("output error"); 


if (ferror(stdin) ) 
err_sys("input error"); 


exit (0); 


} 





注意 ， 在 程序 清单 5-1 和 程序 清单 5-2 的 程序 中 ， 没 有 显 式 地 关闭 标准 MO 流 。 我 们 知道 
exit 函 数 将 会 冲洗 任何 未 写 的 数据 ， 然 后 关闭 所 有 打开 的 流 (我 们 将 在 8.5 节 讨论 这 一 点 )。 将 
这 三 个 程序 的 时 间 与 表 3-2 中 的 时 间 进 行 比较 是 很 有 趣 的 。 表 5-4 中 显示 了 对 同一 文件 (98.5 MB 
FH, 300547) 进行 操作 所 得 的 数据 。 


表 5-4 使 用 标准 VO 例 程 得 到 的 计时 结果 


表 3-2 中 的 最 佳 时 间 
fgets、fputs 
getc, putc 


fgetc, fputc 


表 3-2 中 的 单字 节 时 间 





对 于 这 三 个 标准 WO 版 本 的 每 一 个 ， 其 用 户 CPU 时 间 都 大 于 表 3-2 中 的 最 佳 read 版 本 ， 
为 在 每 次 读 一 个 字符 的 标准 WO 版 本 中 有 一 个 要 执行 1 亿 次 的 循环 ， 而 在 每 次 读 一 行 的 版 本 中 有 
一 个 要 执行 3 144 984 次 的 循环 。 在 read 版 本 中 ， 其 循环 只 需 执行 12 611 次 (对 于 缓冲 区 长 度 
为 8 192 字 节 ) 。 因 为 系统 CPU 时 间 儿 乎 相同 ， 所 以 用 户 CPU 时 间 的 差别 以 及 等 待 JO 结 束 所 消 
耗 时 间 的 差别 造成 了 时 钟 时 间 的 差别 。 

系统 CPU 时 间 几 乎 相同 ， 原 因 是 因为 所 有 这 些 程序 对 内 核 提出 的 读 、 写 请 求 数 基本 相同 。 
注意 ， 使 用 标准 1VO 例 程 的 一 个 优点 是 无 需 考 虑 缓冲 及 最 佳 IO 长 度 的 选择 。 在 使 用 fgets 时 需 
要 考虑 最 大 行 长 ， 但 是 与 选择 最 佳 IO 长 度 比较 ， 这 要 方便 得 多 。 

表 5-4 中 的 最 后 一 列 是 每 个 nain 国 数 的 文本 空间 字 节 数 (由 C 编 译 产生 的 机 器 指令 )。 从 中 
可 见 ， 使 用 getc 和 putc 的 版 本 与 使 用 fgetc 和 fputc 的 版 本 在 文本 空间 长 度 方面 大 体 相同 。 
通常 ，getc 和 putc 实 现 为 宏 ， 但 在 GNU C 库 实现 中 ， 宏 简单 地 扩展 为 函数 调用 。 

使 用 每 次 一 行 WO 版 本 其 速度 大 约 是 每 次 一 个 字符 版 本 的 两 倍 。 如 果 fgets 和 fputs 函 数 
是 用 getc 和 putc 实 现 的 (例如 ， 见 Kernighan 和 Ritchie[1988] 的 7.7 节 )， 那 么 ， 可 以 预期 
fgets 版 本 的 时 间 会 与 getc 版 本 相 接 近 。 实 际 上 ， 每 次 一 行 的 版 本 会 更 慢 一 些 ， 因 为 除了 现 
已 存在 的 6 百 万 次 函数 调用 外 还 需 另 外 增加 2 亿 次 函数 调用 的 开销 。 而 在 本 测试 中 所 用 的 每 次 一 
行 久 数 是 用 memccpy(3) 实 现 的 。 通 常 ， 为 了 提高 效率 ，memccpy 函 数 用 汇编 语言 而 非 C 语 言 
写 。 正 因为 如 此 ， 每 次 一 行 版 本 才 会 有 较 高 的 速度 。 

这 些 时 间 数 字 的 最 后 一 个 有 趣 的 方面 在 于 ，fgetc 版 本 较 表 3-2 中 BUFFSIZE = 1 的 版 本 要 
快 得 多 。 两 者 都 使 用 了 约 2 亿 次 的 函数 调用 ， 而 在 用 户 CPU 时 间 方 面 ，fgetc 版 本 的 速度 大 约 是 
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后 者 的 12 倍 ， 而 在 时 钟 时 间 方 面 则 稍 大 于 25 倍 。 造 成 这 种 差别 的 原因 是 : 使 用 read 的 版 本 执行 
了 2 亿 次 函数 调用 ， 这 也 就 引起 2 亿 次 系统 调用 。 而 对 于 fgetc 版 本 ， 它 也 执行 2 亿 次 函数 调用 ， 
但 是 这 只 引起 25 222 次 系统 调用 。 系 统 调用 与 普通 的 函数 调用 相 比 通常 需要 花费 更 多 的 时 间 ，。 

需要 声明 的 是 这 些 计时 结果 只 在 其 些 系统 上 才 有 效 。 这 种 计时 结果 依赖 于 很 多 实现 的 特征 ， 
而 这 种 特征 对 于 不 同 的 UNIX 系 统 却 可 能 是 不 同 的 。 尽 管 如 此 ， 有 这 样 一 组 数据 ， 并 对 各 种 版 
本 的 差别 作出 解释 ,这 有 助 于 我 们 更 好 地 了 解 系统 。 在 本 节 及 3.9 节 中 我 们 了 解 到 的 基本 事实 是 ， 
标准 MO 库 与 直接 调用 read 和 write 函数 相 比 并 不 慢 很 多 。 我 们 观察 到 使 用 getc 和 putc 复 制 1 
MB 字 节 数据 大 约 需 0.11 秒 的 CPU 时 间 。 对 于 大 多 数 比 较 复 杂 的 应 用 程序 ， 最 主要 的 用 户 CPU 时 
间 是 由 应 用 本 身 的 各 种 处 理 消 耗 的 ， 而 不 是 由 标准 MO 例 程 消 耗 的 。 


5.9 二 进 制 MO 


5.6 节 和 5.7 节 中 的 函数 以 一 次 一 个 字符 或 一 次 一 行 的 方式 进行 操作 。 如 果 进 行 二 进 制 WO 操 
作 ， 那 么 我 们 更 愿意 一 次 读 或 写 整个 结构 。 如 果 使 用 getc 或 putc 读 、 写 一 个 结构 ， 那 么 必须 
循环 通过 整个 结构 ， 每 次 循环 处 理 一 个 字 节 ， 一 次 读 或 写 一 个 字 节 ， 这 会 非常 麻烦 而 且 费 时 。 
如 果 使 用 fputs 和 fgets， 那 么 因为 fputs 在 遇 到 null 字 节 时 就 停止 ， 而 在 结构 中 可 能 含有 null 
字 节 ， 所 以 不 能 使 用 它 实现 读 结 构 的 要 求 。 类 似 地 ， 如 果 输入 数据 中 包含 有 nul 字 节 或 换行 符 ， 
则 fgets 也 不 能 正确 工作 。 因 此 ， 提 供 了 下 列 两 个 函数 以 执行 二 进 制 1O 操 作 。 


#include <stdio.h> 


size_t fread(void *restrict ptr, size_t size, size_t nobj, 
FILE *restrict fp); 


Size t fwrite(const void *restrict ptr, size t size, size_t nobj, 
FILE *restrict fp); 


两 个 函数 的 返回 值 : 读 或 写 的 对 象 数 





这 些 函 数 有 两 种 常见 的 用 法 : 

(1) 读 或 写 一 个 二 进 制 数组 。 例 如 ， 为 了 将 一 个 浮 点 数组 的 第 2 ~5 个 元 素 写 至 一 个 文件 上 ， 
可 以 编写 如 下 程序 ， 

float data[10]; 


if (fwrite(&data[2], sizeof(float), 4, fp) != 4) 
err_sys ("fwrite error"); 


其 中 ， 指 定 size 为 每 个 数组 元 素 的 长 度 ，nobj 为 欲 写 的 元 素数 。 
D 读 或 写 一 个 结构 。 例 如 ， 可 以 编写 如 下 程序 : 


struct { 

short count; 

long total; 

char name [NAMESIZE] ; 
} item; 


if (fwrite(&item, eizeof(item), 1, fp) != 1) 
err Sys("fwrite error"); 


其 中 ， 指 定 size 为 结构 的 长 度 ，nobj 为 1 (要 写 的 对 象 数 ) 。 
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将 这 两 个 例子 结合 起 来 就 可 读 或 写 一 个 结构 数组 。 为 了 做 到 这 一 点 ，size 应 当 是 该 结构 的 
sizeof ，nobj 应 是 该 数组 中 的 元 素 个 数 。 

fread 和 fwrite 返 回 读 或 写 的 对 象 数 。 对 于 读 ， 如 果 出 错 或 到 达 文 件 尾 端 ， 则 此 数字 可 
以 少 于 nobj。 在 这 种 情况 下 ， 应 调用 ferror 或 feof 以 判断 究竟 属于 哪 一 种 情况 。 对 于 写 ， 如 
IB EAST AERA nob), MH. 

使 用 二 进 制 JO 的 基本 问题 是 ， 它 只 能 用 于 读 在 同一 系统 上 已 写 的 数据 。 多 年 之 前 ， 这 并 无 
问题 〈 那 时 ， 所 有 UNIX 系 统 都 运行 于 PDP-11 上 ) ， 而 现在 ， 很 多 异 构 系 统 通过 网 络 相互 连接 起 
来 ， 而 且 ， 这 种 情况 已 经 非常 普遍 。 常 常 有 这 种 情形 ， 在 一 个 系统 上 写 的 数据 ， 要 在 另 一 个 系 
统 上 进行 处 理 。 在 这 种 环境 下 ， 这 两 个 函数 可 能 就 不 能 正常 工作 ， 其 原因 是 ， 

(D 在 一 个 结构 中 ， 同 一 成 员 的 偏 移 量 可 能 因 编 译 器 和 系统 而 异 (由 于 不 同 的 对 准 要 求 ) 。 确 
实 ， 某 些 编 译 器 有 一 个 选项 ， 选 择 它 的 不 同 值 ， 或 者 使 结构 中 的 各 成 员 紧密 包装 (这 可 以 节省 存 
储 空间 ， 而 运行 性 能 则 可 能 有 所 下 降 )， 或 者 准确 对 齐 (以便 在 运行 时 易于 访问 结构 中 的 各 成 员 )。 
这 意味 着 即使 在 同一 个 系统 上 ， 一 个 结构 的 二 进 制 存放 方式 也 可 能 因 编 译 器 选项 的 不 同 而 不 同 。 

(2) 用 来 存储 多 字 节 整数 和 浮 点 值 的 二 进 制 格式 在 不 同 的 机 器 体系 结构 间 也 可 能 不 同 。 

在 第 16 章 讨论 套 接 字 时 ， 我 们 将 涉及 某 些 相关 问题 。 在 不 同系 统 之 间 交 换 二 进 制 数据 的 实 
际 解 决 方法 是 使 用 较 高 级 的 协议 。 关 于 网 络 协议 使 用 的 交换 二 进 制 数据 的 某 些 技术 ， 请 参阅 
Rogo[1993] 的 8.2 节 或 者 Stevens、Fenner 和 Rudoff[2004] 的 5.18 节 。 

在 8.14 节 中 ， 我 们 将 再 回 到 fread 函 数 ， 那 时 将 用 它 读 一 个 二 进 制 结构 
记录 。 


5.10 定位 流 


有 三 种 方法 定位 标准 IO 流 。 

(1) ftel1 和 fseek 国 数 。 这 两 个 国 数 自 V7 以 来 就 存在 了 ， 但 是 它们 都 假定 文件 的 位 置 可 
以 存放 在 一 个 长 整 型 中 。 

(2) ftello 和 fseeko 国 数 。Single UNIX Specification 引 入 了 这 两 个 函数 ， 可 以 使 文件 偏 
移 量 不 必 一 定 使 用 长 整 型 。 它 们 使 用 off_t 数 据 类 型 代替 了 长 整 型 。 

(3) fgetpos 和 fsetpos 国 数 。 这 两 个 函数 是 由 ISO C 引 入 的 。 它 们 使 用 一 个 抽象 数据 类 
型 fpos_t 记 录 文 件 的 位 置 。 这 种 数据 类 型 可 以 定义 为 记录 一 个 文件 位 置 所 需 的 长 度 。 

需要 移植 到 非 UNIX 系 统 上 运行 的 应 用 程序 应 当 使 用 fgetpos 和 fsetpos。 





UNIX 的 进程 会 计 


#include <stdio.h> 
long ftell (FILE *fp) ; 


返回 值 : 若 成 功 则 返回 当前 文件 位 置 指示 ， 若 出 错 则 返回 -1L 


int fseek(FILE *fp, long offset, int whence) ; 


返回 值 : 若 成 功 则 返回 0， 若 出 错 则 返回 非 0 值 


void rewind(FILE *fp) ; 





对 于 一 个 二 进 制 文件 ， 其 文件 位 置 指示 器 是 从 文件 起 始 位 置 开始 度量 ， 并 以 字 节 为 计量 单 
位 。ftel1 用 于 二 进 制 文件 时 ， 其 返回 值 就 是 这 种 字 节 位 置 。 为 了 用 fseek 定 位 一 个 二 进 制 文 
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件 ， 必 须 指定 一 个 字 节 offset， 以 及 解释 这 种 偏 移 量 的 方式 。whence 的 值 与 3.6 节 中 1seek 函 数 
的 相同 SEEK_SET 表 示 从 文件 的 起 始 位 置 开 始 ，SEEK_CUR 表 示 从 当前 文件 位 置 开始 ， 
SEEK_END 表 示 从 文件 的 尾 端 开始 。ISO C 并 不 要 求 一 个 实现 对 二 进 制 文件 支持 SEEK_END 规 范 
说 明 ， 其 原因 是 某 些 系 统 要 求 二 进 制 文件 的 长 度 是 某 个 幻 数 的 整数 倍 ， 非 实际 内 容 部 分 则 充填 
0。 但 是 在 UNIX 中 ， 对 于 二 进 制 文件 ，SEEK_END 是 受 支持 的 。 

对 于 文本 文件 ， 它 们 的 文件 当前 位 置 可 能 不 以 简单 的 字 节 偏 移 量 来 度量 。 这 主要 也 是 在 非 
UNIX 系 统 中 ， 它 们 可 能 以 不 同 的 格式 存放 文本 文件 。 为 了 定位 一 个 文本 文件 ，whence 一 定 要 
是 SEEK_SET， 而 且 offset 只 能 有 两 种 值 ， 0 ( 绕 回 到 文件 的 起 始 位 置 ) ， 或 是 对 该 文件 调用 
ftell 所 返回 的 值 。 使 用 rewind 函 数 也 可 将 一 个 流 设置 到 文件 的 起 始 位 置 。 

除了 of fset 的 类 型 是 off_t 而 非 1ong 以 外 ， ftellomm&sftell fil, fseeko me 
与 fseek 相 同 。 


#include <stdio.h> 


off t ftello(FILE *fp); 


返回 值 ， 若 成 功 则 返回 当前 文件 位 置 指示 ， 若 出 错 则 返回 -1 
int fseeko(FILE *fp, off t offset, int whence); 
返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 非 0 值 





回忆 3.6 节 中 对 off_t 数 据 类 型 的 讨论 。 实 现 可 将 of f_t 类 型 定义 为 长 于 32 位 。 
正如 我 们 已 提 及 的 ，fgetpos 和 fsetpos 这 两 个 函数 是 C 标 准 引进 的 。 
#include <stdio.h> 

int fgetpos (FILE *restrict fp, fpos t *restrict pos); 

int fsetpos(FILE *fp, const fpos t *pos); 


两 个 函数 返回 值 : 若 成 功 则 返回 0， 若 出 错 则 返回 非 0 值 





fgetpos 将 文件 位 置 指 示 器 的 当前 值 存 人 由 pos 指 向 的 对 象 中 。 在 以 后 调用 fsetpos 时 ， 
可 以 使 用 此 值 将 流 重新 定位 至 该 位 置 。 


5.11 格式 化 VO 


1. 格式 化 输出 

执行 格式 化 输出 处 理 的 是 4 个 printf 国 数 。 

#include <stdio.h> 

int printf(const char *restrict format, ...); 

int fprintf(FILE *restrict fp. const char *restrict format, ...); 


两 个 函数 返回 值 ， 若 成 功 则 返回 输出 字符 数 ， 若 输出 出 错 则 返回 负 值 


int sprintf (char *restrict buf, const char *restrict format, ...); 


int snprintf(char *restrict buf, size t n, 
const char *restrict format, ...); 


两 个 函数 返回 值 : 若 成 功 则 返回 存 人 数组 的 字符 数 ， 若 编码 出 错 则 返回 负 值 
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printf 将 格式 化 数据 写 到 标准 输出 ，fprintf 写 至 指定 的 流 ，sprintf 将 格式 化 的 字符 
送 入 数组 buf 中 。sprintf 在 该 数组 的 尾 端 自动 加 一 个 null 字 节 ， 但 该 字 节 不 包括 在 返回 值 中 。 

注意 ，sprintf 函 数 可 能 会 造成 由 bu 指向 的 缓 串 区 的 溢出 。 调 用 者 有 责任 确保 该 缓冲 区 
足够 大 。 为 了 解决 这 种 缓冲 区 溢出 问题 ， 引 入 了 snprintf 函 数 。 在 该 函数 中 ,缓冲 区 长 度 是 
一 个 显 式 参数 ， 超 过 缓冲 区 尾 端 写 的 任何 字符 都 会 被 丢弃 。 如 果 缓 冲 区 足够 大 ，snprintf 国 
数 就 会 返回 写 人 缓冲 区 的 字符 数 。 与 sprintf 相 同 ， 该 返回 值 不 包括 结尾 的 nul 字 节 。 落 
snprintf 函 数 返 回 小 于 缓冲 区 长 度 " 的 正 值 ， 那 么 没有 截 短 输 出 。 若 发 生 了 一 个 编码 错误 ， 
snprintf 则 返回 负 值 。 

格式 说 明 控 制 其 余 参 数 如 何 编写 ， 以 后 又 如 何 显示 。 每 个 参数 按照 转换 说 明 编写 ， 转 换 说 
明 以 字符 % 开 始 ， 除 转换 说 明 外 ， 格 式 字符 串 中 的 其 他 字符 将 按 原样 ， 不 经 任何 修改 地 被 复制 - 
输出 。 一 个 转换 说 明 有 4 个 可 选 部 分 ， 下 面 将 它们 都 示 于 方 括号 中 : 


% (flags) [£1dwidth] [precision] [lenmodifier] convtype 
表 5-5 中 总 结 了 各 种 标志 (flages), 
5-5 转换 说 明 中 的 标志 部 分 


在 字段 内 左 对 齐 输出 
总 是 显示 带 符号 转换 的 符号 


如 果 第 一 个 字符 不 是 符号 ， 则 在 其 前 面 加 土 一 个 空格 
指定 另 一 种 转换 形式 (例如 ， 对 于 十 六 进 制 格式 ， 加 0x 前 缀 ) 
添加 前 导 0 (而 非 空格 ) 进行 填充 


f1dwidth 说 明 转 换 的 最 小 字段 宽度 。 如 果 转 换 得 到 的 字符 较 少 ， 则 用 空格 填充 它 。 字 有 段 
宽度 是 一 个 非 负 十 进 制 数 ， 或 是 一 个 星 号 (*). 

precision 说 明 整 型 转换 后 最 少 输出 数字 位 数 、 浮 点 数 转 换 后 小 数 点 后 的 最 少 位 数 、 字 
符 串 转 换 后 的 最 大 字符 数 。 精 度 是 一 个 句点 〈.) ， 后 接 一 个 可 选 的 非 负 十 进 制 整数 或 一 个 星 
9 (*), 

宽度 和 精度 字段 两 者 皆 可 为 *。 此 时 ， 一 个 整 型 参数 指定 宽度 或 精度 的 值 。 该 整 型 参数 正 
好 位 于 被 转换 的 参数 之 前 。 

lenmodifier 说 明 参 数 长 度 。 其 可 能 的 取 值 示 于 表 5-6 中 。 


表 5-6 转换 说 明 中 的 长 度 修饰 符 





有 符号 或 无 符号 的 char 
有 符号 或 无 符号 的 short 
有 符号 或 无 符号 的 1ong 或 者 宽 字 符 


有 符号 或 无 符号 的 long long 


intmax_t 或 uintmax._t 


size_t 


ptrdiff t 





long double 
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convtype 不 是 可 选 的 。 它 控制 如 何 解释 参数 。 表 5-7 中 列 出 了 各 种 转换 类 型 。 
表 5-7 转换 说 明 中 的 转换 类 型 部 分 


ko 有 符号 十 进 制 

无 符号 八进制 

无 符号 十 进 制 

无 符号 十 六 进 制 

double ÆA% 

指数 格式 的 aouble 精 度 浮 点 数 

解释 为 f、FE、e 或 E， 取 决 于 被 转换 的 值 

十 六 进 制 指数 格式 的 aouble 精 度 浮 点 数 

字符 (车 带 长 度 修饰 符 1， 则 为 宽 字符 ) 

字符 串 (EPKEMA, WAXER) 

指向 voig 的 指针 

将 到 目前 为 止 ， 所 写 的 字符 数 写 和 到 指针 
所 指向 的 无 符号 整 型 中 

% 字 符 

宽 字符 (XSI 扩展 ， 等 效 于 1c) 

宽 字 符 串 〈(XSI 扩 展 ， 等 效 于 1s) 


u 
x, 
f, 
e, 
g, 
a, 
c 
s 
p 
n 





下 列 4 种 printf 族 的 变 体 类 似 于 上 面 的 4 种 ， 但 是 可 变 参数 表 (..….) 代 换 成 了 arg。 


#include <stdarg.h> 
#include <stdio.h> 


int vprintf(const char *restrict format, va_list arg); 


int vfprintf(FILE *restrict fp, const char *restrict format, 
va list arg); 


两 个 函数 返回 值 ， 若 成 功 则 返回 输出 字符 数 ， 若 输出 出 错 则 返回 负 值 


int veprintf (char *restrict buf, const char *restrict format, 
va_list arg); 


int venprintf (char *restrict buf, size t n, 
const char *restrict format, va list arg); 


两 个 函数 返回 值 ， 若 成 功 则 返回 存 人 数组 的 字符 数 ， 若 编码 出 错 则 返回 负 值 
在 附录 B 的 出 错 处 理 例 程 中 ， 将 使 用 vsnprintf 函 数 。 
关于 ISO C 标 准 中 有 关 可 变 长 度 参数 表 的 详细 说 明 请 参阅 Kernighan 和 Ritchie[1988] 的 7.3 节 。 


应 当 了 解 的 是 ， 由 ISO C 提 供 的 可 变 长 度 参数 表 例 程 (<stdarg .h> 头 文件 和 相关 的 例 程 ) 与 
由 较 早 版 本 UNIX 提 供 的 <-varargs .h> 例 程 是 不 同 的 。 


2. 格式 化 输入 
执行 格式 化 输入 处 理 的 是 三 个 scanf BR, 
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#include <stdio.h> 


int scanf (const char *restrict format, ...); 


int fecanf (FILE *restrict fp, const char *restrict format, ...); 


int sscanf(const char *restrict buf, const char *restrict format, 
ee); A 


三 个 函数 返回 值 ; 指定 的 输入 项 数 ， 若 输入 出 错 或 在 任意 变换 前 已 到 达 文 件 结尾 则 返回 EOF 


scanf 族 用 于 分 析 输入 字符 串 ， 并 将 字符 序列 转换 成 指定 类 型 的 变量 。 格 式 之 后 的 各 参数 
[151] 包含 了 变量 的 地 址 ， 以 用 转换 结果 初始 化 这 些 变量 。 
格式 说 明 控制 如 何 转 换 参数 ， 以 便 对 它们 赋值 。 转 换 说 明 以 % 字 符 开 始 。 除 转换 说 明和 空 
白字 符 外 ， 格 式 字符 串 中 的 其 他 字符 必须 与 输入 匹配 。 若 有 一 个 字符 不 匹配 ， 则 停止 后 续 处 理 ， 
不 再 读 输入 的 其 余部 分 。 
一 个 转换 说 明 有 三 个 可 选 部 分 ， 下 面 将 它们 都 示 于 方 括号 中 ， 


* [*] [£1dwidth] [lenmodifier] convtype 


可 选 的 前 导 星 号 (*) 用 于 抑制 转换 。 按 照 转换 说 明 的 其 余部 分 对 输入 进行 转换 ， 但 转换 
结果 并 不 存放 在 参数 中 。 

fldwidth 说 明 最 大 宽度 (〈 即 最 大 字符 数 )。1Lenmodifiezr 说 明 要 用 转换 结果 初始 化 的 参 
数 大 小 。 由 printf 函 数 族 支持 的 长 度 修饰 符 同 样 得 到 scanf 函 数 族 的 支持 ( 见 表 5-6 中 的 长 度 
修饰 符 列表 )。 

convtype 字 段 类 似 于 printf 族 的 转换 类 型 字段 ， 但 两 者 之 间 还 有 些 差别 。 一 个 差别 是 ， 
存储 在 无 符号 类 型 中 的 结果 可 在 输入 时 带 上 符号 。 例 如 ， 一 1 可 被 转换 成 4 294 967 295 赋 予 无 符 
号 整 型 变量 。 表 5-8 列 出 了 scanf 函 数 族 支持 的 转换 类 型 。 


表 5-8 ”转换 说 明 中 的 转换 类 型 





有 符号 十 进 制 ， 基 数 为 10 

有 符号 十 进 制 ， 基 数 由 输入 格式 决定 

无 符号 八进制 (输入 可 选 地 有 符号 ) 

无 符号 十 进 制 ， 基 数 为 10 (输入 可 选 地 有 符号 ) 
无 符号 十 六 进 制 (输入 可 选 地 有 符号 ) 

字符 (车 带 长 度 修 饰 符 1， 则 为 宽 字符 ) 

字符 串 (车 带 长 度 修饰 符 1， 则 为 宽 字符 串 ) 
匹配 列 出 的 字符 序列 ， 以 ] 终 止 

匹配 除 列 出 字符 以 外 的 所 有 字符 ， 以 ] 终 止 
指向 voia 的 指针 

将 到 目前 为 止 读 取 的 字符 数 写 入 到 指针 所 指向 的 无 符号 整 型 中 
SET 

AF (XSI 扩 展 ， 等 效 于 1c ) 

宽 字 符 串 (XSI 扩 展 ， 等 效 于 1s) 





a 
i 
o 
u 
x 
a. 
c 
S 
[ 
[^ 
p 
n 
$ 
C 
S 
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与 printf 族 一 样 ，scanf 族 也 支持 函数 使 用 由 <stdarg .h> 说 明 的 可 变 参 数 表 。 


#include <stdarg.h> 
#include <stdio.h> 


int vscanf(const char *restrict format, va list arg); 


int vfscanf(FILE *restrict fp, const char *restrict format, 
va list arg); 


int vsscanf (const char *restrict buf, const char *restrict format , 
va list arg); 


三 个 函数 返回 值 ， 指 定 的 输入 项 数 ， 若 输入 出 错 或 在 
任 一 变换 前 已 到 达 文 件 结尾 则 返回 EOF 


关于 scanf 函 数 族 的 详细 情况 ， 请 参阅 UNIX 系 统 手册 。 
5.12 实现 细节 


正如 前 述 ， 在 UNIX 系 统 中 ， 标 准 VO 库 最 终 都 要 调用 第 3 章 中 说 明 的 WO 例 程 。 每 个 标准 WO 
流 都 有 一 个 与 其 相关 联 的 文件 描述 符 ， 可 以 对 一 个 流 调用 fileno 函 数 以 获得 其 描述 符 。 


注意 ，fileno 不 是 ISO C 标准 部 分 ， 而 是 POSIX.1 支 持 的 扩展 。 =~ 





#include <stdio.h> 


int fileno(FILE *fp) ; 





返回 值 : 与 该 流 相 关联 的 文件 描述 符 


如 果 要 调用 dup 或 fcnt1 等 函数 ， 则 需要 此 函数 。 

为 了 了 解 你 所 使 用 的 系统 中 标准 IO 库 的 实现 ， 最 好 从 头 文件 <stdaio .h> 开 始 。 从 中 可 以 
看 到 : FILE 对 象 是 如 何 定义 的 、 每 个 流标 志 的 定义 以 及 定义 为 宏 的 各 个 标准 IO 例 程 〈 例 如 
getc)。Kernighan 和 Ritchie[1988] 中 的 8.5 节 含有 一 个 示例 实现 ， 从 中 可 以 看 到 很 多 UNIX 实 现 
的 基本 样式 。Plauger[1992] 的 第 12 章 提供 了 标准 MO 库 一 种 实现 的 全 部 源 代 码 。GNU 标 准 IO 库 
的 实现 也 是 公开 可 以 使 用 的 。 


实 例 


程序 清单 5-3 中 的 程序 为 三 个 标准 流 以 及 -- 个 与 普通 文件 相关 联 的 流 打 印 有 关 缓 冲 的 状态 
信息 。 
程序 清单 5-3 对 各 个 标准 MO 流 打印 缓冲 状态 信息 
#include "apue.h" 
void pr_stdio(const char *, FILE *); 
int 


main (void) 


{ 


FILE *fp; 
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fputs("enter any character\n", stdout); 
if (getchar() == EOF) 
err_sys("getchar error"); 
fputs ("one line to standard error\n", stderr); 


pr_stdio("stdin", stdin); 
pr_stdio("stdout", stdout) ; 
pr_stdio("stderr", stderr); 


if ((fp = fopen("/etc/motd", "r")) == NULL) 
err sys("fopen error"); 
if (getc(fp) -- EOF) 
err sys("getc error"); 
pr stdio("/etc/motd", fp); 
exit (0); 
} 
void 
pr_stdio(const char *name, FILE *fp) 


{ 


printf ("stream = $s, ", name); 
/* 
* The following is nonportable. 
*/ 


if (fp-» IO file flags & IO UNBUFFERED) 
printf ("unbuffered"); 
else if (fp-» IO file flags & IO LINE BUF) 
printf ("line buffered"); 
else /* if neither of above */ 
printf ("fully buffered"); 
printf(", buffer size = $dWMn", fp-» IO buf end - fp-» IO buf base); 





注意 ， 在 打印 缓冲 状态 信息 之 前 ， 先 对 每 个 流 执行 VO 操作 ， 第 一 个 VO 操作 通常 就 造成 为 
该 流 分 配 缓冲 。 结 构成 员 _IO_file_flags、_IO_buf_base、_IO_buf_end 和 常量 _IO_ 
UNBUFFERED、_IO_LINE_BUFFERED 是 由 Linux 中 的 GNU 标 准 IO 库 定义 的 。 应 当 了 解 ， 其 他 
UNIX 系 统 可 能 会 有 不 同 的 标准 MO 库 实现 。 
如 果 运 行程 序 清单 5-3 中 的 程序 两 次 ， 一 次 使 三 个 标准 流 与 终端 相连 接 ， 另 一 次 使 它们 重 定 
向 到 普通 文件 ， 则 所 得 结果 是 : 


$ ./a.out stdin, stdout#lstderr hie fti 
enter any character 

键 人 换行 符 
one line to standard error 
stream = stdin, line buffered, buffer size = 1024 
stream = stdout, line buffered, buffer size = 1024 
stream = stderr, unbuffered, buffer size = 1 
stream = /etc/motd, fully buffered, buffer size = 4096 
$ ./a.out < /etc/termcap > std.out 2» std.err 

三 个 流 都 重 定向 ， 再 次 运行 该 程序 
$ cat std.err 
one line to standard error 
$ cat std.out 
enter any character 
Stream - stdin, fully buffered, buffer size - 4096 
stream - stdout, fully buffered, buffer size - 4096 
stream stderr, unbuffered, buffer size = 1 
stream /etc/motd, fully buffered, buffer size = 4096 


全 
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从 中 可 见 ， 该 系统 的 默认 情况 是 : 当 标 准 输入 、 输 出 连 至 终端 时 ， 它 们 是 行 缓冲 的 。 行 组 
冲 的 长 度 是 1024 字 节 。 注 意 ， 这 并 没有 将 输入 、 输 出 的 行 长 限制 为 1024 字 节 ， 这 只 是 缓冲 区 的 
长 度 。 如 果 要 将 2048 字 节 的 行 写 到 标准 输出 ， 则 要 进行 两 次 write 系统 调用 。 当 将 这 两 个 流 重 
定向 到 普通 文件 时 ， 它 们 就 变 成 是 全 缓冲 的 ， 其 缓冲 区 长 度 是 该 文件 系统 优先 选用 的 MO 长 度 
(从 stat 结 构 中 得 到 的 st_blksize 值 )。 从 中 也 可 看 到 ， 标 准 出 错 如 它 所 应 该 的 那样 是 非 组 
冲 的， 而 普通 文件 按 系 统 默 认 是 全 缓冲 的 。 oO 


5.13 临时 文件 
ISO C 标 准 MO 库 提供 了 两 个 函数 以 帮助 创建 临时 文件 。 








#include <stdio.h> 


char *tmpnam(char *ptr); 
返回 值 : 指向 唯一 路 径 名 的 指针 
FILE *tmpfile (void); 
上 返回 值 ， 若 成 功 则 返回 文件 指针 ， 若 出 错 则 返回 NULL 





tmpnam 国 数 产 生 一 个 与 现 有 文件 名 不 同 的 一 个 有 效 路 径 名 字符 串 。 每 次 调用 它 时 ， 它 都 产生 
一 个 不 同 的 路 径 名 ， 最 多 调用 次 数 是 TMP_MAX。TMP_MAX 定 义 在 <stdio.h> 中 。 


虽然 ISO C 定 义 了 TMP_MAX， 但 该 标准 只 要 求 其 值 至 少 应 为 25。 但 是 ，Single UNIX Specification 却 
要 求 遵循 XSI 的 系统 支持 其 值 至 少 为 10 000。 虽 然 此 最 小 值 克 许 一 个 实现 使 用 4 位 数字 (0000 — 9999) 
作为 临时 文件 名 ， 但 是 ， 大 多 数 UNIX 实 现 使 用 的 却 是 大 、 小 写字 符 。 


车 ptr 是 NULL， 则 所 产生 的 路 径 名 存放 在 一 个 静态 区 中 ， 指 向 该 静态 区 的 指针 作为 函数 值 
返回 。 下 一 次 再 调用 tmpnam 时 ， 会 重 写 该 静态 区 (这 意味 着 ， 如 果 我 们 调用 此 函数 多 次 ， 而 
且 想 保存 路 径 名 ， 则 我 们 应 当 保 存 该 路 径 名 的 副本 ， 而 不 是 指针 的 副本 )。 如 若 ptr 不 是 NULL， 
则 认为 它 指向 长 度 至 少 是 L_tmpnam 个 字符 的 数组 (常量 L_tmpnam 定 义 在 头 文件 <stdio.h> 
中 )。 所 产生 的 路 径 名 存放 在 该 数组 中 ，pitr 也 作为 函数 值 返回 。 

tmpfile 创 建 一 个 临时 二 进 制 文件 (类 型 wb+)， 在 关闭 该 文件 或 程序 结束 时 将 自动 删除 
这 种 文件 。 注 意 ，UNIX 对 二 进 制 文件 不 作 特殊 区 分 。 


实 例 
程序 清单 5-4 中 的 程序 演示 了 这 两 个 函数 的 应 用 。 
程序 清单 5-4 tmpnam 和 tmpfile 函 数 实例 
#include "apue.h" 
int 
main (void) 


char name[L tmpnam], line [MAXLINE] ; 
FILE *fp; 


printf("$sWMn", tmpnam(NULL)); /* first temp name */ 
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tmpnam (name) ; /* second temp name */ 
printf ("%s\n", name); 
if ((fp = tmpfile()) == NULL) /* create temp file */ 
err_sys("tmpfile error"); 
fputs ("one line of output\n", fp); /* write to temp file */ 
rewind (fp); /* then read it back */ 
if (fgets(line, sizeof(line), fp) == NULL) 
err_sys("fgets error"); 
fputs(line, stdout); /* print the line we wrote */ 
exit (0); 


) 
执行 程序 清单 5-4 中 的 程序 ， 可 得 ， 


$ ./a.out 
/tmp/fileClIcwc 
/tmp/filemSkHSe 
one line of output 


tmpfile 国 数 经 常 使 用 的 标准 UNIX 技 术 是 先 调 用 Empnam 产 生 一 个 唯一 的 路 径 名 ， 然 后 ， 
用 该 路 径 名 创建 一 个 文件 ， 并 立即 unlink 它 。 回 忆 4.15 节 ， 对 一 个 文件 解除 链接 并 不 会 删除 
其 内 容 ， 关 闭 该 文件 时 才 删 除 其 内 容 。 而 关闭 文件 可 以 是 显 式 进行 的 ， 也 可 以 在 程序 终止 时 删 
除 其 内 容 。 

Single UNIX Specification 为 处 理 临 时 文件 定义 了 另外 两 个 函数 ， 它 们 是 XSI 的 扩展 部 分 。 
其 中 第 一 个 是 tempnam 函 数 。 





#include <stdio.h> 


Char *tempnam(const char *directory, const char * prefix) ; 


返回 值 ， 指向 唯一 路 径 名 的 指针 


tempnam 古 tmpnam 的 一 个 变 体 ， 它 允许 调用 者 为 所 产生 的 路 径 名 指定 目录 和 前 绷 。 对 于 
目录 有 4 种 不 同 的 选择 ， 按 下 列 顺序 判断 其 条 件 是 否 为 真 ， 并 且 使 用 第 一 个 为 真 的 作为 目录 ， 

(1) 如 果 定 义 了 环境 变量 TMPDIR， 则 用 其 作为 目录 。( 在 7.9 节 中 将 说 明 环 境 变量 。) 

(2) 如 果 参 数 directory4ENULL， 则 用 其 作为 目录 。 

(3) 将 <stdio.h> 中 的 字符 串 P_tmpdir 用 作 目 录 。 

(4) 将 本 地 目录 (通常 是 /tmp) 用 作 目 录 。 

如 果 prefixdFNULL， 则 它 应 该 是 最 多 包含 5 个 字符 的 字符 串 ， 用 其 作为 文件 名 的 头 几 个 字符 。 

该 函数 调用 mal1oc 函 数 分 配 动态 存储 区 ， 用 其 存放 所 构造 的 路 径 名 。 当 不 再 使 用 此 路 径 
名 时 就 可 释放 此 存储 区 (7.8 节 将 说 明 mal1oc 和 free 函 数 )。 口 





程序 清单 5-5 中 的 程序 显示 了 tempnam 的 应 用 。 
程序 清单 5-5 演示 tempnam 函 数 


#include "apue.h" 


int 
main(int argc, char *argv[]) 
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if (argc != 3) 
err quit("usage: a.out «directory» «prefix»"); 


printf ("%s\n", tempnam(argv[1] [0] != ' ' ? argv[1] : NULL, 
argv[2] [0] != ' * ? argv[2] : NULL)); 
exit(0); 


) 





注意 ， 如 果 命 令 行 参数 (目录 或 前 级 ) 中 的 任 一 个 以 空白 开始 ， 则 将 其 作为 null 指 针 传 送 
给 该 函数 。 下 面 显 示 使 用 该 程序 的 各 种 方式 。 


$ ./a.out /home/sar TEMP 指定 具 录 和 前 绥 
/home/sar/TEMPsf00zi 

$ ./a.out " " PFX 使 用 默认 目录 : P. tmpdir 
/tmp/PFX£Bw7Gi 

$ TMPDIRs/var/tmp ./a.out /usr/tmp " " 使 用 环境 变量 ， 无 前 级 
/var/tmp/file8fVYNi 环境 变量 覆盖 目录 

$ TMPDIR-/no/such/dir ./a.out /home/sar/tmp QQQ 
/home/sar/tmp/QQO98s8Ui 忽略 无 效 环境 和 目录 


上 述 选择 目 录 名 的 四 个 步骤 按 序 执行 ， 该 函数 也 检查 相应 的 目录 名 是 否 有 意义 。 如 果 该 目 
录 并 不 存在 (例如 /no/such/dir)， 则 跳 过 这 一 步 ， 试 探 对 目录 名 的 下 一 次 选择 。 从 本 例 中 
可 以 看 出 在 本 实现 中 ，p_tmpdir 目 录 是 /tmp。 我 们 用 来 设置 环境 变量 的 技术 (在 程序 名 前 指 
定 TMPDIR=) 是 由 Bourne shell、Kornshell 和 bash 使 用 的 。 oO 


XSI 定 义 的 第 二 个 函数 是 mkstemp。 它 类 似 于 tmpfile, 但 是 该 函数 返回 的 不 是 文件 指针 ， 
而 是 临时 文件 的 打开 文件 描述 符 。 


#include «stdlib.h» 


int mkstemp(char *template) ; 





返回 值 : 若 成 功 则 返回 文件 摘 述 符 ， 若 出 错 则 返回 -1 


它 所 返回 的 文件 描述 符 可 用 于 读 、 写 该 文件 。 临 时 文件 的 名 字 是 用 template 字 符 串 参数 选 
择 的 。 该 字符 串 是 一 个 路 径 名 ， 其 最 后 6 个 字符 设置 为 XXXXXX。 该 函数 用 不 同 字符 代 换 
XXXXXX， 以 创建 唯一 路 径 名 。 如 若 mkstemp 成 功 返 回 ， 它 就 会 修改 template 字 符 串 以 反映 临 
时 文件 的 名 字 。 

与 tempfile 不 同 的 是 ，mkstemp 创 建 的 临时 文件 不 会 自动 被 删除 。 如 若 想 从 文件 系统 名 
字 空 间 中 删除 该 文件 ， 则 我 们 需要 自行 unlink 它 。 

使 用 tmpnam 和 tempnam 的 一 个 不 足 之 处 是 : 在 返回 唯一 路 径 名 和 应 用 程序 用 该 路 径 名 创 
建文 件 之 间 有 一 个 时 间 窗 口 。 在 该 时 间 窗 口 期 间 ， 另 一 个 进程 可 能 创建 一 个 同名 文件 。 
tempfile 和 mkstemp 函 数 则 不 会 产生 此 种 问题 ， 可 以 使 用 它们 代 赫 tmpnam 和 tempnam。 


mktemp 有 函数 类 似 于 mkstemp ， 只 不 过 mktemp 只 构建 一 个 过 用 于 临时 文件 的 名 字 ， 它 没有 创建 一 
个 文件 ， 所 以 它 也 有 与 tmpnarm 和 tempnam 相 同 的 不 足 之 处 。mktemp 函 数 在 Single UNIX Specification ? 
被 标记 为 遗留 接口 。Single UNIX Specification 的 未 来 县 本 可 能 将 遗留 接 口 例 部 删除 、 因 此 应 当 和 避免 使 
用 它 。 
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5.14 标准 MO 的 替代 软件 


标准 IO 库 并 不 完善 。Korn 和 Vo[1991] 列 出 了 它 的 很 多 不 足 之 处 ， 其 中 ， 有 些 属 于 基本 设计 ， 
而 大 多 数 则 与 各 种 不 同 的 实现 有 关 。 

标准 LO 库 的 一 个 不 足 之 处 是 效率 不 高 ， 这 与 它 需 要 复制 的 数据 量 有 关 。 当 使 用 每 次 一 行 函 
数 fgets 和 fputs 时 ， 通常 需 要 复制 两 次 数据 : 一 次 是 在 内 核 和 标准 IO 缓冲 之 间 ( 当 调 用 
readq 和 write 时 )， 第 二 次 是 在 标准 IO 缓冲 区 和 用 户 程序 中 的 行 缓 冲 区 之 间 。 快 速 IO 订 
[AT&T 1990a 中 的 fio(3)] 避 免 了 这 一 点 ， 其 方法 是 使 读 一 行 的 函数 返回 指向 该 行 的 指针 ， 而 不 是 
将 该 行 复制 到 另 一 个 缓冲 区 中 。Hume[1988] 报 告 ， 由 于 执行 了 这 种 更 改 ，grep (1) 实用 程序 的 
速度 增加 了 两 倍 。 

Korm 和 Vo[1991] 说 明了 标准 IO 库 的 另 一 种 代替 版 本 ，sfio。 这 一 软件 包 在 速度 上 与 fio 相 近 ， 
通常 快 于 标准 MO 库 。sfio 软 件 包 也 提供 了 一 些 其 他 标准 MO 库 所 没有 的 新 特征 :推广 了 UVO 流 ， 
使 其 不 仅 可 以 代表 文件 ， 也 可 代表 存储 区 ， 可 以 编写 处 理 模块 ， 并 以 栈 方式 将 其 压 信 LO 流 ， 这 
样 就 可 以 改变 一 个 流 的 操作 ， 较 好 的 异常 处 理 等 。 

Krieger、Stumm 和 Unrau[1992] 说 明了 另 一 个 替代 软件 包 ， 它 使 用 了 映射 文件 -一 mmap 函 
数 ， 我 们 将 在 12.9 节 中 说 明 此 函数 。 该 新 软件 包 称 为 ASI (Alloc Stream Interface) 。 其 编程 接口 . 
类 似 于 UNIX 存 储 分 配 函 数 (malloc、realloc 和 free， 这 些 将 在 7.8 节 中 说 明 )。 与 sfio 软 件 
包 相 同 ，ASI 使 用 指针 力图 减少 数据 复制 量 。 

许多 标准 WO 库 实现 可 用 于 C 函 数 库 中 ， 这 种 C 函 数 库 是 为 内 存 较 小 的 系统 (例如 修 入 式 系 
统 ) 设计 的 。 这 些 实现 对 于 合理 内 存 要 求 的 关注 超过 对 可 移植 性 、 速 度 以 及 功能 性 等 方面 的 关 
注 。 这 类 国 数 库 的 两 种 实现 是 :uClibc CH (WMhttp://www.uclibc.org) 和 newlibc CHE 


(http://www.source.redhat.com/newlib) , 
5.15 人 小结 


大 多 数 UNIX 应 用 程序 都 使 用 标准 VO 库 。 本 章 说 明了 该 库 提供 的 所 有 函数 ， 以 及 某 些 实现 
细节 和 效率 方面 的 考虑 。 应 该 看 到 标准 1O 库 使 用 了 缓冲 技术 ， 而 它 正 是 产生 很 多 问题 ， 引 起 许 
多 混淆 的 一 个 区 域 。 
习题 
5.1 用 setvbuf 实 现 setbuf。 

5.2 5.8 节 中 的 程序 利用 fgets 和 fputs 函 数 复制 文件 ， 每 次 WO 操作 只 复制 一 行 。 若 将 程序 中 

的 MAXLINE 改 为 4， 当 复制 的 行 超过 该 最 大 值 时 会 发 生 什 么 情况 ?对 此 进行 解释 。 

5.3 printf 返 回 0 值 意味 着 什么 ? 
5.4 下 面 的 代码 在 一 些 机 器 上 运行 正确 ， 而 在 另外 一 些 机 器 运行 时 出 错 ， 解 释 问 题 所 在 。 

#include <stdio.h> 

int 

main (void) 


char Gi 
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while ((c = getchar()) != EOF) 
putchar(c); 
) 
5.5 为 什么 tempnam 限 制 前 毕 为 5 个 字符 ? 
5.6 对 标准 LVO 流 如 何 使 用 fsync 函 数 ( 见 3.13 节 ) ? 
5.7 在 程序 清单 1-5 和 程序 清单 1-8 的 程序 中 ， 打 印 的 提示 信息 没有 包含 换行 符 ， 程 序 也 没有 调 
用 fflush 函 数 ， 请 解释 输出 提示 信息 的 原因 是 什么 ? 
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61 引言 


UNIX 系 统 的 正常 运行 需要 使 用 大 量 与 系统 有 关 的 数据 文件 ， 例 如 ， 口 令 文件 /etc/ 
passwd 和 组 文件 /etc/group 就 是 经 常 由 多 种 程序 使 用 的 两 个 文件 。 用 户 每 次 登录 UNIX 系 统 ， 
以 及 每 次 执行 ]s -1 命令 时 都 要 使 用 口令 文件 。 

由 于 历史 原因 ， 这 些 数 据 文件 都 是 ASCII 文 本 文件 ， 并 且 使 用 标准 VO 库 读 这 些 文件 。 但 是 ， 
对 于 较 大 的 系统 ， 顺 序 扫描 口令 文件 非常 耗 时 ， 我 们 需要 能 够 以 非 ASCII 文 本 格式 存放 这 些 文 
件 ， 但 仍 向 应 用 程序 提供 可 以 处 理 任 何 一 种 文件 格式 的 接口 。 针 对 这 些 数据 文件 的 可 移植 接口 
是 本 章 的 主题 。 本 章 还 介绍 了 系统 标识 函数 、 时 间 和 日 期 函数 。 


6.2 口令 文件 


UNIX 系 统 的 口令 文件 (POSIX.1 则 将 其 称 为 用 户 数据 库 ) 包含 了 表 6-1 中 所 示 的 各 字段 ， 
这 些 字段 包含 在 <pwd .h> 中 定义 的 passwd 结 构 中 。 


注意 ，POSIX.1 只 指定 了 passwd 结 构 包 含 的 10 个 字段 中 的 5 个 。 大 多 数 平台 至 少 支持 其 中 7 个 字段 。 
BSD 派 生 的 平台 支持 全 部 10 个 字段 。 


表 6-1 /etc/passwd 文 件 中 的 字段 


用 户 名 char *pw_name 
加 密 口令 char *pw_passwd 
数值 用 户 ID uid_t pw_uid 
数值 组 ID gid_t pw_gid 


注释 字段 char *pw_gecos 
初始 工作 目录 char *pw_dir 

初始 shell( 用 户 程序 ) | char *pw_shell 
用 户 访问 类 char *pw_class 
下 次 更 改口 令 时 间 | time_t pw change 
账户 到 期 时 间 time_t pw_expire 


由 于 历史 原因 ， 口 令 文件 存储 在 /etc/passwd 中 ,而 且 是 一 个 ASCII 文 件 。 每 一 行 包含 表 
6-! 中 所 示 的 各 字段 ， 字 段 之 间 用 冒号 分 隔 。 例 如 ， 在 Linux 上 ， 该 文件 中 可 能 有 下 列 四 行 : 


root :x:0:0:root:/root:/bin/bash 
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squid:x:23:23::/var/spool/squid: /dev/null 
nobody: x: 65534 : 65534 : Nobody: /home: /bin/sh 
sar:x:205:105:Stephen Rago: /home/sar:/bin/bash 


关于 这 些 登 录 项 请 注意 下 列 各 点 : 

。 通 常 有 一 个 用 户 名 为 root 的 登录 项 ， 其 用 户 ID 是 0 (超级 用 户 )。 

* 加 密 口令 字段 包含 了 一 个 占 位 字符 。 在 早期 的 UNIX 系 统 版 本 中 ， 该 字段 存放 加 窗口 令 
将 加 密 口令 存放 在 一 个 人 人 可 读 的 文件 中 构成 了 一 个 安全 性 漏洞 ， 所 以 现在 将 加 密 口令 
存放 在 另 一 个 位 置 。 在 下 一 节 讨 论 口令 时 ， 我 们 将 详细 涉及 此 问题 。 

“口令 文件 项 中 的 某 些 字段 可 能 是 空 。 如 果 加 密 口令 字段 为 空 ， 这 通常 就 意味 着 该 用 户 没 
有 口令 (不 推荐 这 样 做 ) 。 saui 登录 项 有 一 个 空白 字段， 注释 字段 。 空 白 注释 字段 不 产 
生 任何 影响 。 

。shel] 字 段 包含 了 一 个 可 执行 程序 名 ， 它 彼 用 作 该 用 户 的 登录 shell。 若 该 字段 为 空 ， 则 取 
系统 默认 值 ， 通 常 是 /bin/sh。 注 意 ，squid 登 录 项 的 该 字段 为 /dev/null。 显 然 ， 这 
是 一 个 设备 ， 不 能 执行 ， 因 此 将 其 用 于 此 处 的 目的 是 ， 阻 止 任何 人 以 用 户 squid 的 名 义 
登录 到 该 系统 。 


很 多 服务 对 于 帮助 它们 得 以 实现 的 不 同 守护 进程 使 用 不 同 的 用 户 ID ( 见 第 13 章 )，、squid 项 是 为 实 
现 sGuid 代 理 缓冲 服务 而 设置 的 。 


* 为 了 阻止 一 个 特定 用 户 登 录 系 统 ， 除 使 用 /dev/null 之 外 ， 还 有 车 于 种 替代 方法 。 
常见 的 方法 是 ， 将 /bin/false 用 作 登 录 shel。 它 简单 地 以 不 成 功 ( 非 0) ERE. d 
shell 将 此 种 终止 状态 判断 为 假 。 另 一 种 常见 方法 是 ， 用 /bin/true 禁 止 一 个 账户 。 它 所 
做 的 一 切 是 以 成 功 (0) 状态 终止 。 某 些 系统 提供 nologin 命 令 ， 它 打印 可 自 定义 的 出 错 
信息 ， 然 后 以 非 0 状 态 终止 

. 使 用 ncboay 用 户 名 的 目的 是 ， 使 任何 人 都 可 登录 至 系统 ， 但 其 用 户 ID (65534) 和 组 ID 
(65534) 不 提供 任何 特权 。 该 用 户 ID 和 组 ID 只 能 访问 人 人 皆 可 读 、 写 的 文件 (假定 用 户 
ID 65534 和 组 ID 65534 并 不 拥有 任何 文件 ， 而 实际 情况 就 应 如 此 )。 

“提供 finger(1) 命 令 的 某 些 UNIX 系 统 支持 注释 字段 中 的 附加 信息 。 其 中 ， 各 部 分 之 间 都 
Hhg OE: 用 户 姓名 、 办 公 室 地 点 、 办 公 室 电话 号 码 以 及 家 庭 电话 号 码 等 。 另 外 ， 如 
采 注 释 字 段 中 的 用 户 姓名 是 一 个 &， 则 将 其 替换 为 登录 名 。 例 如 ， 可 以 有 下 列 记 录 ，; 
Sar:x:205:105:Steve Rago, SF 5-121, 555-1111, 555-2222: /home/sar: /bin/sh 
使 用 finger 命 令 就 可 打印 Steve Rago 的 有 关 信 息 。 


$ finger -p sar 

Login: sar Name: Steve Rago 
Directory: /home/sar Shell: /bin/sh 

Office: SF 5-121, 555-1111 Home Phone: 555-2222 
On since Mon Jan 19 03:57 (EST) on ttyvO (messages off) 
No Mail. 


即使 你 所 使 用 的 系统 并 不 支持 Einger 命 令 ， 这 些 信 息 仍 可 存放 在 注释 字段 中 ， 该 字 
段 只 是 一 个 注释 ， 并 不 由 系统 实用 程序 解释 。 
某 些 系统 提供 了 vipw 命 令 ， 允 许 管理 员 使 用 该 命令 编辑 口令 文件 。vipw 命 令 串 行 化 对 口 
令 文件 所 做 的 更 改 ， 并 且 确保 所 做 的 更 改 与 其 他 相关 文件 保持 _ 致 。 系统 也 常常 经 由 图 形 用 户 
界面 (GUI) 提供 类 似 的 功能 。 
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POSIX.1 只 定义 了 两 个 获取 口令 文件 项 的 函数 。 在 给 出 用 户 登录 名 或 数值 用 户 ID 后 ， 这 两 
个 函数 就 能 查询 相关 项 。 


#include <pwd.h> 


struct passwd *getpwuid(uid_t uid); 


struct passwd *getpwnam(const char *name) ; 


两 个 国 数 返 回 值 : 车 成 功 则 返回 指针 ， 若 出 错 则 返回 NULL 





getpwuid 际 数 由 1s(1) 程 序 使 用 ， 它 将 i 节点 中 的 数值 用 户 ID 映 射 为 用 户 登录 名 。 在 键入 
SRAM, getpwname BH login BAER. 

这 两 个 函数 都 返回 一 个 指向 passwd 结 构 的 指针 ， 该 结构 已 由 这 两 个 函数 在 执行 时 填 入 信 
息 。passwd 结 构 通常 是 相关 函数 内 的 静态 变量 ， 只 要 调用 相关 函数 ， 其 内 容 就 会 被 重 写 。 

如 果 要 查看 的 只 是 登录 名 或 用 户 ID， 那 么 这 两 个 POSIX.1 函 数 能 满足 要 求 ， 但 是 也 有 些 程 
序 要 查看 整个 口令 文件 。 下 列 三 个 函数 则 可 用 于 此 种 目的 。 


#include <pwd.h> 


struct passwd *getpwent (void) ; 


返回 值 : 若 成 功 则 返回 指针 ， 若 出 错 或 到 达 文件 结尾 则 返回 NULL 


void setpwent (void) ; 


void endpwent (void) ; 





基本 POSIX.1 标 准 没有 定义 这 三 个 函数 。 在 Singie UNIX Specification 中 .它们 被 定义 为 XSI 扩 展 。 
因此 ， 预 期 所 有 UNIX 实 现 都 将 提供 这 些 函 数 。 


调用 getpwent 时 ， 它 返回 口令 文件 中 的 下 一 个 记录 项 。 如 同上 面 所 述 的 两 个 POSIX.1 函 
数 一 样 ， 它 返回 一 个 由 它 填 写 好 的 password 结 构 的 指针 。 每 次 调用 此 函数 时 都 重 写 该 结构 。 
在 第 一 次 调用 该 函数 时 ， 它 打开 它 所 使 用 的 各 个 文件 。 在 使 用 本 函数 时 ， 对 口令 文件 中 各 个 记 
录 项 的 安排 顺序 并 无 要 求 。 某 些 系统 采用 散 列 算法 对 /etc/passwd 文 件 中 的 各 项 排序 。 

冰 数 setpwent 反 绕 它 所 使 用 的 文件 ，endpwent 则 关闭 这 些 文件 。 在 使 用 getpwent 查 
看 完 口 令 文件 后 ， 一定 要 调用 endpwent 关 闭 这 些 文件 。getpwent 知 道 什么 时 间 它 应 当 打 开 
它 所 使 用 的 文件 (第 一 次 被 调用 时 )， 但 是 它 并 不 知道 何 时 关闭 这 些 文件 。 


实例 
程序 清单 6-1 给 出 了 getpwnam 函 数 的 一 个 实现 。 


程序 清单 6-1 getpwnam 函 数 


#include <pwd.h> 
#include <stddef .h> 
#include <string.h> 


struct passwd * 
getpwnam(const char *name) 
struct passwd  *ptr; 


setpwent (); 
while ((ptr = getpwent()) != NULL) 
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if (strcmp (name, ptr->pw_name) == 0) 
break; /* found a match */ 
endpwent () ; . 
return (ptr); /* ptr is NULL if no match found */ 


} 


在 程序 开始 处 调用 setpwent 是 自我 保护 性 的 措施 ， 以 便 在 调用 者 在 此 之 前 已 经 调用 
getpwent 打 开 了 有 关 文 件 情 况 下 ， 反 绕 有 关 文 件 使 它们 定位 到 文件 开始 处 。getpwnam 和 
getpwuid 调 用 完成 后 不 应 使 有 关 文 件 仍 处 于 打开 状态 ， 所 以 应 调用 endpwent 关 闭 它们 。 O 


6.3 阴影 口令 


加 密 口 令 是 经 单 向 加 密 算法 处 理 过 的 用 户口 令 副 本 。 因 为 此 算法 是 单 向 的 ， 所 以 不 能 从 加 
窗口 令 猜测 到 原来 的 口令 。 

历史 上 使 用 的 算法 ( 见 Morris 和 Thompson[1979]) 总 是 从 64 字 符 集 [a-zA-Z0-9./] 中 产生 13 个 
可 打印 字符 。 某 些 较 新 的 系统 使 用 MD5 算 法 对 口令 加 密 ， 为 每 个 加 窗口 令 产生 31 个 字符 。( 加 
窗口 令 的 字符 愈 多 , 这 些 字符 的 组 合 也 就 愈 多 , 于 是 用 各 种 可 能 组 合 来 猜测 口令 的 难度 就 愈 大 。) 
当 我 们 将 一 个 字符 放 在 加 窗口 令 字段 中 时 ， 可 以 确保 任 一 加 密 口令 都 不 会 与 其 相 匹 配 。 

给 出 一 个 加 密 口令 ， 找 不 到 一 种 算法 可 以 将 其 逆转 到 普通 文本 口令 (普通 文本 口令 是 在 
Password :提示 符 后 键 人 的 口令 )。 但 是 可 以 对 口令 进行 猜测 ， 将 猜测 的 口令 经 单 向 算法 变换 
成 加 密 形式 ， 然 后 将 其 与 用 户 的 加 窗口 令 相 比较 。 如 果 用 户口 令 是 随机 选择 的 ， 那 么 这 种 方法 
并 不 是 很 有 用 。 但 是 用 户 往往 以 非 随机 方式 选择 口令 (例如 配偶 的 姓名 、 街 名 、 完 物 名 等 )。 
一 个 经 常 重复 的 试验 是 先 得 到 一 份 口令 文件 ， 然 后 用 试探 方法 猜测 口令 。(Garfinkel 等 [2003] 的 
第 4 章 对 UNIX 口 令 及 口令 加 密 处 理 模式 的 历史 情况 及 细节 进行 了 说 明 。) 

为 使 企图 这 样 做 的 人 难以 获得 原始 资料 (加 密 口令 ) ， 现 在 ， 某 些 系统 将 加 密 口令 存放 在 
另 一 个 通常 称 为 阴影 口令 (shadow password) 的 文件 中 。 该 文件 至 少 要 包含 用 户 名 和 加 密 口 令 。 
与 该 口令 相关 的 其 他 信息 也 可 存放 在 该 文件 中 (366-2). 


表 6-2 etc/shadow 文 件 中 的 字段 


用 户 登录 名 char *sp_namp 
meas char *sp_pwdp 
上 次 更 改口 令 以 来 经 过 的 时 间 i sp_lstchg 
经 过 多 少 天 后 允许 更 改 i Sp min 


要 求 更 改 尚 余天 数 i sp_max 
到 期 警告 天 数 i sp_warn 
账户 不 活动 之 前 尚 余天 数 int sp_inact 
账户 到 期 天 数 i sp_expire 
165 保留 unsigned int sp_flag 





只 有 用 户 登 录 名 和 加 密 口 令 这 两 个 字段 是 必需 的 。 其 他 字段 用 于 控制 口令 的 改动 频率 ( 称 
为 口令 的 衰老 ) 以 及 账户 保持 活动 状态 的 时 间 。 

阴影 口令 文件 不 应 是 一 般 用 户 可 以 读 取 的 。 仅 有 少数 几 个 程序 需要 存 取 加 窗口 令 ， 例 如 
login(1) 和 passwa(1)， 这 些 程序 常常 是 设置 用 户 ID 为 root 的 程序 。 有 了 阴影 口令 后 ， 普 通 
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口令 文件 /etc/passwd 可 由 各 用 户 自由 读 取 。 

在 Linux 2.4.22 和 Solaris 9 中 ， 与 访问 口令 文件 的 一 组 函数 类 似 ， 有 另 一 组 函数 可 用 于 访问 
阴影 口令 文件 。 

#include «shadow.h» 

struct spwd *getspnam(const char *name); 


struct spwd *getspent (void); 


两 个 函数 返回 值 : 若 成 功 则 返回 指针 ， 若 出 错 则 返回 NULL 


void setspent (void) ; 


void endspent (void) ; 
在 FreeBSD 5.2.1 和 MAC OS X 10.3 中 ， 没 有 阴影 口令 结构 。 附 加 的 账户 信息 存放 在 口令 文 
件 中 〈 见 表 6-1)。 


6.4 组 文件 


UNIX 组 文件 (POSIX.1 称 其 为 组 数据 库 ) 包含 了 表 6-3 中 所 示 的 字段 。 这 些 字段 包含 在 
<grp .h> 中 所 定义 的 group 结 构 中 。 


表 6-3 /etc/group 文 件 中 的 字段 








[OO | *gr, name 












A 口令 char *gr_passwd 
数值 组 ID int gr_gid 
指向 各 用 户 名 的 char **gr_mem 


指针 的 数组 


字段 gr_mem 是 一 个 指针 数组 ， 其 中 每 个 指针 各 指向 一 个 属于 该 组 的 用 户 名 。 该 数组 以 空 
指针 结尾 。 
可 以 用 下 列 两 个 由 POSIX.1 定 义 的 函数 来 查看 组 名 或 数值 组 ID 。 


#include <grp.h> 


struct group *getgrgid(gid_t gid); 


struct group *getgrnam(const char *name) ; 
两 个 函数 返回 值 : 若 成 功 则 返回 指针 ， 若 出 错 则 返回 NULD 
如 同 对 口令 文件 进行 操作 的 函数 一 样 ， 这 两 个 函数 通常 也 返回 指向 一 个 静态 变量 的 指针 ， 
在 每 次 调用 时 都 重 写 该 静态 变量 。 
如 果 和 需要 搜索 整个 组 文件 ， 则 和 需 使 用 另外 几 个 尔 数 。 下 列 三 个 函数 类 似 于 针对 口令 文件 的 
三 个 函数 。 


#include <grp.h> 





struct group *getgrent (void) ; 


返回 值 ， 若 成 功 则 返回 指针 ， 若 出 错 或 到 达 文 件 结尾 则 返回 NULL 


void setgrent (void) ; 





void endgrent (void) ; 
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这 三 个 函数 不 是 基本 POSIX.1 标 准 的 组 成 部 分 。Single UNIX Specification 的 XSI 扩 展 定义 了 这 些 函 
数 。 所 有 UNIX 系 统 都 提供 这 三 个 函数 。 


setgrent 函 数 打开 组 文件 (如 车 它 尚 未 被 打开 ) 并 反 绕 它 。getgrent 国 数 从 组 文件 中 
读 下 一 个 记录 ， 如 若 访 文件 尚未 打开 则 先 打 开 它 。endgrent 函 数 关闭 组 文件 。 


6.5 附加 组 ID 


在 UNIX 中 ， 对 组 的 使 用 已 经 作 了 些 更 改 。 在 V7 中 ， 每 个 用 户 任何 时 候 都 只 属于 一 个 组 。 
当 用 户 登录 时 ， 系 统 就 按 口令 文件 记录 项 中 的 数值 组 ID， 赋 给 他 实际 组 ID。 可 以 在 任何 时 候 执 
行 hewgrp(1) 以 更 改组 DD。 如 果 newgrp 命 令 执行 成 功 ( 关 于 权限 规则 ， 请 参阅 手册 )， 则 实际 
组 ID 就 更 改 为 新 的 组 DD， 它 将 被 用 于 后 续 的 文件 访问 权限 检查 。 执 行 不 带 任何 参数 的 newgrp， 
则 可 返回 到 原来 的 组 。 

这 种 组 成 员 形式 一 直 维持 到 1983 年 左右 。 此 时 ，4.2BSD 引 入 了 附加 组 ID (supplementary 
group ID) 的 概念 。 我 们 不 仅 可 以 属于 口令 文件 记录 项 中 组 ID 所 对 应 的 组 ， 也 可 属于 多 达 16 个 
另外 的 组 。 文 件 访问 权限 检查 相应 被 修改 为 : 不 仅 将 进程 的 有 效 组 ID 与 文件 的 组 ID 相 比较 ， 而 
且 也 将 所 有 附加 组 卫 与 文件 的 组 思 进 行 比较 。 

附加 组 ID 是 POSIX,1 要 求 的 特性 。( 在 较 早 的 POSIX.1 版 本 中 ， 该 特性 是 可 选 的 。) 常量 
NGROUPS MAX ( 见 表 2-10) 规定 了 附加 组 ID 的 数量 ， 其 常用 值 是 16 ( 见 表 2-12) 。 


使 用 附加 组 阵 的 优点 是 不 必 再 显 式 地 经 常 更 改组 。 一 个 用 户 会 参加 多 个 项 目 ， 因 此 也 就 要 
同时 属于 多 个 组 。 此 类 情况 是 经 常 有 的 。 
为 了 获取 和 设置 附加 组 ID， 提 供 了 下 列 三 个 函数 : 


#include <unistd.h> 
int getgroups(int gidsetsize, gid_t grouplist(]) ; 
返回 值 : 若 成 功 则 返回 附加 组 卫 数 ， 若 出 错 则 返回 -1 


#include «grp.h» /* on Linux */ 
#include <unistd.h> /* on FreeBSD, Mac OS X, and Solaris */ 


int setgroups(int ngroups, const gid t grouplist[]) ; 


Binclude «grp.h» /* on Linux and Solaris */ 
#include <unistd.h> /* on FreeBSD and Mac OS X */ 


int initgroups(const char *username, gid t basegid); 





两 个 函数 返回 值 ， 若 成 功 则 返回 9， 若 出 错 则 返回 -1 


在 这 三 个 函数 中 . POSIX.1 只 说 明了 getgroups。 因 为 setgroups 和 iniLgroups 是 特权 操作 ， 所 
以 它们 并 非 POSIX.1 的 组 成 部 分 。 但 是 ， 本 书 说 明 的 所 有 四 种 平台 都 支持 这 三 个 函数 。 
在 Mac OS X 10.3 中 ，basegid 被 声明 为 int 类 型 。 


getgroups 将 各 附加 组 ID 填 写 到 数组 grouplist 中 ， 该 数组 中 存放 的 元 素 最 多 为 gidsetsize 个 。 
实际 填写 到 数组 中 的 附加 组 ID 数 由 函数 返回 。 
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作为 一 个 特例 ， 如 车 gidsetsize 为 0， 则 函数 只 返回 附加 组 ID 数 ， 而 对 数组 grouplist 则 不 作 修 
改 〈 这 使 调用 者 可 以 确定 grouplis 数 组 的 长 度 ， 以 便 进 行 分 配 ) 。 

Setgroups 可 由 超级 用 户 调用 以 便 为 调用 进程 设置 附加 组 ID 表 。grouplist 是 组 ID 数 组， 而 
ngroups 指 定 了 数组 中 的 元 素 个 数 。ngroups 的 值 不 能 大 于 NGROUPS_MAX。 | 

通常 ， 只 有 initgroups 函 数 调用 setgroups，initgroups 读 整个 组 文件 (用 前 而 说 
明 的 函数 getgrent、setgrent 和 endgrent)， 然后 对 username 确 定 其 组 的 成 员 关 系 。 然 后 ， 
它 调 用 setgroups， 以 便 为 该 用 户 初始 化 附加 组 人 D 表 。 因 为 jnitgroups 调 用 setgroups， 
所 以 只 有 超级 用 户 才 能 调用 initgroups。 除 了 在 组 文件 中 找到 username 是 成 员 的 所 有 组 ， 
initgroups 也 在 附加 组 ID 表 中 包括 了 basegid。basegid 是 username 在 口令 文件 中 的 组 ID。 

只 有 少数 几 个 程序 调用 initgroups， 例 如 1ogin(1) 程 序 在 用 户 登 录 时 调用 该 函数 。 


6.6 实现 的 区 别 


我 们 已 讨论 了 Linux 和 Solaris 支 持 的 阴影 口令 文件 。FreeBSD 和 MAC OS X 则 以 不 同方 式 存 
储 加 密 口令 。 表 6-4 总 结 了 本 书 涉及 的 四 种 平台 如 何 存 放 用 户 和 组 信息 。 


表 6-4 ”账户 实现 的 区 别 


账户 信息 /etc/passwd /etc/passwd netinfo /etc/passwd 


加 窗口 令 /etc/master.passwd /etc/shadow netinfo /etc/shadow 
散 列 口令 文件 ? 是 T 否 T 
组 信息 /etc/group /etc/group netinfo /etc/group 





在 FreeBSD 中 ， 阴 影 口令 文件 是 /etc/master .passwd。 可 以 使 用 特殊 命令 编辑 该 文件 ， 
它 反 过 来 会 从 阴影 口令 文件 产生 /etc/passwd 的 一 个 副本 。 另 外 ， 还 会 产生 该 文件 的 散 列 版 
本 。/etc/pwd .db 是 /etc/passwd 的 散 列 版 本 ，/etc/spwd.db 是 /etc/master. 
passwd 的 散 列 版 本 。 这 些 为 大 型 系统 提供 了 更 好 的 性 能 。 

但 是 ，Mac OS X 只 以 单 用 户 模 式 使 用 /etc/passwd 和 /etc/master .passwd,。 (在 维 
护 系 统 时 ， 单 用 户 模式 通常 意味 着 不 能 提供 任何 系统 服务 。) 正常 运行 期 间 的 多 用 户 方式 即 
netinfo 目 录 服 务 提供 对 用 户 和 组 账户 信息 的 访问 。 

虽然 Linux 和 Solaris 支 持 类 似 的 阴影 口令 接口 ， 但 两 者 之 间 存 在 某 些微 妙 的 区 别 。 例 如 ， 表 
6-2 中 所 示 的 整 型 字段 在 Solaris 中 定义 为 nt 类型， 在 Linux 中 则 定义 为 long int。 另 一 个 区 别 
是 账户 不 活动 字段 。Solaris 将 其 定义 为 用 户 上 次 登录 以 来 所 经 过 的 天 数 ， 而 Linux 则 将 其 定义 为 
到 口令 过 期 的 尚 余天 数 。 

在 很 多 系统 中 ， 用 户 和 组 数据 库 是 用 网 络 信息 服务 (Network Information Service, NIS) 
实现 的 。 这 使 管理 员 可 编辑 数据 库 的 主 副本 ， 然 后 将 它 自 动 分 发 到 组 织 中 的 所 有 服务 器 上 。 客 
户 端 系统 可 以 联系 服务 器 以 查看 用 户 和 组 的 有 关 信 息 。NIS+ 和 轻 量 级 目录 访问 协议 
(Lightweight Directory Access Protocol，LDAP) 提供 了 类 似 功 能 。 很 多 系统 通过 配置 文件 
/etc/nsswitch.conf 来 控制 管理 每 一 类 信息 的 方法 。 


6.7 其 他 数据 文件 
至 此 仅 讨论 了 两 个 系统 数据 文件 一 一 口令 文件 和 组 文件 。 在 日 常 操作 中 ，UNIX 系 统 还 使 
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用 很 多 其 他 文件 。 例 如 ，BSD 网 络 软件 有 一 个 记录 各 网 络 服务 器 所 提供 服务 的 数据 文件 
(/etc/services)， 有 一 个 记录 协议 信息 的 数据 文件 (/etc/protocols)， 还 有 一 个 则 是 
记录 网 络 信息 的 数据 文件 (/etc/networks)。 幸 运 的 是 ， 针 对 这 些 数据 文件 的 接口 都 与 上 
述 针对 口令 文件 和 组 文件 的 接口 相似 。 

一 般 情况 下 ， 对 于 每 个 数据 文件 至 少 有 三 个 函数 : 

(1) get ee: 读 下 一 个 记录 ， 如 果 需 要 ， 还 可 打开 该 文件 。 这 些 函 数 通常 返回 指向 一 个 结 
构 的 指针 。 当 已 到 达 文 件 尾 端 时 则 返回 空 指针 。 大 多 数 get 函 数 返回 指向 一 个 静态 结构 的 指针 ， 
如 果 要 保存 其 内 容 ， 则 需 复制 它 。 

(2) set eae: 打开 相应 数据 文件 (如果 尚 未 打开 ) ， 然 后 反 绕 该 文件 。 如 果 希 望 在 相应 文 
件 起 始 处 开始 处 理 ， 则 调用 此 函数 。 

(3) end 函 数 : 关闭 相应 数据 文件 。 正 如 前 述 ， 在 结束 了 对 相应 数据 文件 的 读 、 写 操作 后 ， 
总 应 调用 此 函数 以 关闭 所 有 相关 文件 。 

另外 ， 如 果 数 据 文件 支持 某 种 形式 的 关键 字 搜 索 ， 则 会 提供 搜索 具有 指定 关键 字 记 录 的 例 
程 。 例 如 ， 对 于 口令 文件 ， 提 供 了 两 个 按 关 键 字 进 行 搜索 的 程序 : getpwnam 寻 找 具 有 指定 用 
户 名 的 记录 ;getpwuid 寻 找 具 有 指定 用 户 ID 的 记录 。 

表 6-5 中 列 出 了 一 些 这 样 的 例 程 ， 这 些 都 是 UNIX 系 统 常 用 的 。 在 表 6-5 中 列 出 了 针对 口令 文 
件 和 组 文件 的 函数 ， 这 些 已 在 上 面 说 明 过 。 表 6-5 中 也 列 出 了 一 些 与 网 络 有 关 的 函数 。 对 于 表 6- 
5 中 列 出 的 所 有 数据 文件 都 有 get、set 和 end 函 数 。 


ROS 存 取 系 统 数据 文件 的 类 似 例 程 


/etc/passwd «pwd.h» passwd getpwnam, 0 
/etc/group «grp.h» group getgrnam, getgrgid 
/etc/shadow «shadow.h» spwd getspnam 

/etc/hosts «netdb.h» hostent gethostbyname, gethostbyaddr 
/etc/networks <netdb.h> netent getnetbyname, getnetbyaddr 


/etc/protocols «netdb.h» protoent getprotobyname, getprotobynumber 


/etc/services <netdb.h> servent getservbyname, getservbyport 





在 Solaris 中 ， 表 6-5 中 的 最 后 四 个 数据 文件 都 是 符号 链接 ， 它 们 都 链接 到 目录 /etcyinet 下 的 同名 
文件 上 。 大 多 数 UNIX 都 有 类 似 于 该 表 中 所 列 的 附加 函数 ,但 是 这 些 附 加 的 函数 关 在 处 理 系 统管 理 文件 ， 
专用 于 各 个 实现 。 


6.8 登录 账户 记录 


大 多 数 UNIX 系 统 都 提供 下 列 两 个 数据 文件 ， utmp 文 件 ， 它 记录 当前 登录 进 系统 的 各 个 用 
户 ，wtmp 文 件 ， 它 跟踪 各 个 登录 和 注销 事件 。 在 V7 中 ， 每 次 写 入 这 两 个 文件 中 的 是 包含 下 列 
结构 的 一 条 二 进 制 记录 : 


struct utmp { 


char ut line[8]; /* tty line: "ttyho", "ttydO", "ttypo", ... */ 
char ut name[8]; /* login name */ 
long ut time; /* seconds since Epoch */ 


ps 
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登录 时 ，1login 程 序 填写 此 类 型 结构 ， 然 后 将 其 写 信 到 utmp 文 件 中 ， 同 时 也 将 其 添 写 到 
wtmp 文 件 中 。 注 销 时 ，init 进 程 将 utmp 文 件 中 相应 的 记录 擦 除 (每 个 字 节 都 填 以 0) ， 并 将 一 
个 新 记录 深 写 到 wtmp 文 件 中 。 在 wtmp 文 件 的 注销 记录 中 ， 将 ut_name 字 段 清 0。 在 系统 重新 
启动 时 ， 以 及 更 改 系 统 时 间 和 日 期 的 前 后 ， 都 在 wtmp 文 件 中 添 写 特殊 的 记录 项 。who(1) 程 序 
读 utmp 文 件 ， 并 以 可 读 格式 打印 其 内 容 。 后 来 的 UNIX 版 本 提供 了 last(1) 命 令 ， 它 读 wtmp 文 
件 并 打印 所 选择 的 记录 。 

大 多 数 UNIX 版 本 仍 提供 utmp 和 wtmp 文 件 ， 但 正如 所 期 望 的 ， 其 中 的 信息 量 却 增加 了 。V7 
中 20 字 节 的 结构 在 SVR2 中 已 扩充 为 36 字 节 ， 而 在 SVR4 中 ，utmp 结 构 已 扩充 到 多 于 350 字 节 .。 


在 Solaris 中 ， 这 些 记 录 的 详细 格式 请 参见 手册 页 utmpx(4)。 在 Solaris 9 中 ， 这 两 个 文件 都 在 目录 
/Var/aGm 中 。Solaris 提 供 了 很 多 函数 ( 见 getutx(3)) 用 于 读 或 写 这 两 个 文件 。 

# FreeBSD 5.2.1, Linux 2.4.22 和 Mac OS X 10.3 中 ， 登 录 记 录 的 格式 请 参见 手册 页 utmp(5)。 这 两 
个 文件 的 路 径 名 是 /var/run/utmp 和 /var/1log/wtmp。 


6.9 系统 标识 
POSIX.1 定 义 了 uname 函 数 ， 它 返回 与 当前 主机 和 操作 系统 有 关 的 信息 。 


#include «sys/utsname.h» 


int uname (struct utsname *name) ; 


返回 值 : 车 成 功 则 返回 非 负 值 ， 若 出 错 则 返回 -1 





通过 该 函数 的 参数 向 其 传递 一 个 utsname 结 构 的 地 址 ， 然 后 该 函数 填写 此 结构 。POSIX.1 
只 定义 了 该 结构 中 至 少 需 提供 的 字段 (它们 都 是 字符 数组 )， 而 每 个 数组 的 长 度 则 由 实现 确定 。 


某 些 实现 在 该 结构 中 提供 了 另外 一 些 字段 。 171 
struct utsname { 
char sysname[]; /* name of the operating system */ 
char nodename[]; /* name of this node */ 
char release[]; /* current release of operating system */ 
char version[]; /* current version of this release */ 
char machine[]; /* name of hardware type */ 


}; 


每 个 字符 串 都 以 null 字 符 结尾 。 本 书 讨论 的 四 种 平台 支持 的 最 大 名 字 长 度 列 于 表 6-6 中 。 
utsname 结 构 中 的 信息 通常 可 用 uname(1) 命 令 打 印 。 


POSIX.1 警 告 nodename 元 素 可 能 并 不 运用 于 引用 通信 网 络 上 的 主机 。 此 函数 来 自 于 系统 V、 在 早 
期 . nodename 元 素 运 用 于 引用 UUCP 网 络 上 的 主机 。 

还 要 认识 到 在 此 结构 中 并 没有 给 出 有 关 POSIX.1 版 本 的 信息 。 应 当 使 用 2.6 节 中 所 说 明 的 _POSIX_ 
VERSION 以 获得 该 信息 。 

最 后 ， 此 函数 给 出 了 一 种 获取 该 结构 中 信息 的 方法 ， 至 于 如 何 初 始 化 这 些 信息 ，POSIX.1 没 有 络 
出 任何 说 明 。 


历史 上 ，BSD 派 生 的 系统 提供 了 gethostname 函 数 ， 它 只 返回 主机 名 ,该 名 字 通 常 就 是 
TCP/IP 网 络 上 主机 的 名 字 。 
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#include <unistd.h> 


int gethostname(char *name, int namelen) ; 


返回 值 : 若 成 功 则 返回 0， 若 出 错 则 返回 一 1 


namelen 参 数 指定 name 缓 冲 区 长 度 ， 如 若 提 供 足 够 的 空间 ， 则 通过 name 返 回 的 字符 串 以 null 
结尾 。 如 若 没 有 提供 足够 的 空间 ， 则 没有 指定 通过 name 返 回 的 字符 串 是 否 以 null 结 尾 。 
现在 ，gethostname 函 数 已 定义 为 POSIX.1 的 一 部 分 ， 它 指定 最 大 主机 名 长 度 是 HOST_ 
NAME_MAX。 表 6-6 中 列 出 了 本 书 讨论 的 四 种 实现 支持 的 最 大 名 字 长 度 。 
表 6-6 系统 标识 名 字 限 制 


最 大 名 字 长 度 








uname is 
gethostname 256 
172 如 果 将 主机 连接 到 TCP/IP 网 络 中 ， 则 此 主机 名 通常 是 该 主机 的 完全 限定 域名 。 


hostname(1) 命 令 可 用 来 获取 和 设置 主机 名 。( 超 级 用 户 用 一 个 类 似 的 函数 sethostname 来 
设置 主机 名 。) 主机 名 通常 在 系统 自 举 时 设置 ， 它 由 /etc/rc 或 init 取 自 一 个 启动 文件 。 


6.10 时间 和 日 期 例 程 


由 UNIX 内 核 提供 的 基本 时 间 服 务 是 计算 自 国际 标准 时 间 公元 1970 年 1 月 1 日 00:00:00 以 来 经 
过 的 秒 数 。1.10 节 中 曾 提 及 这 种 秒 数 是 以 数据 类 型 time_t 表 示 的 。 我 们 称 它们 为 日 历时 间 。 
日 历时 间 包 括 时 间 和 日 期 。UNIX 在 这 方面 与 其 他 操作 系统 的 区 别 是 ，(a) 以 国际 标准 时 间 而 非 
本 地 时 间 计 时 ，(b) 可 自动 进行 转换 ， 例 如 变换 到 夏 时 制 ，(c) 将 时 间 和 日 期 作为 一 个 量 值 保存 。 

time 函 数 返 回 当 前 时 间 和 日 期 。 


#include <time.h> 


time t time(time t *calptr) ; 





返回 值 : 若 成 功 则 返回 时 间 值 ， 若 出 错 则 返回 -1 





时 间 值 总 是 作为 函数 值 返回 。 如 果 参 数 不 为 空 ， 则 时 间 值 也 存放 在 由 coljprr 指 向 的 单元 内 。 


在 系统 V 派 生 的 系统 中 ， 调 用 stime(2) 函 数 ， 在 BSD 派 生 的 系统 中 ， 则 调用 settimeofday(2), 
用 于 对 内 核 中 的 当前 时 间 设 置 初始 值 。 
Single UNIX Specification 没 有 说 明 系 统 如 何 设置 其 当前 时 间 。 


与 time 函数 相 比 ，gettimeofday 提 供 了 更 高 的 分 辩 率 (最 高 为 微 秒 级 ) 。 这 对 某 些 应 用 
很 重要 。 


#include <sys/time.h> 


int gettimeofday(struct timeval *restrict tp, void *restrict tzp) ; 





返回 值 : 总 是 返回 0 


bbs.theithome.com 





6.10 时 间 和 日 期 例 程 143 


该 函数 作为 XSI 扩 展 定义 在 Single UNIX Specification 中 ，tzp 的 唯一 合法 值 是 NULL， 其 他 
值 则 将 产生 不 确定 的 结果 。 某 些 平台 支持 用 tzp 说 明 时 区 ， 但 这 完全 依 实现 而 定 ， 并 不 由 Single 
UNIX Specification 定 义 。 
gettimeofday 尔 数 将 当前 时 间 存放 在 tp 指向 的 timeval 结 构 中 ， 而 该 结构 存储 秒 和 微 秒 。 
struct timeval { 
time t tv sec; /* seconds */ 
long tv usec; /* microseconds */ 
}; 
一 且 取 得 这 种 以 秒 计 的 整 型 时 间 值 后 ， 通 常 要 调用 另 一 个 时 间 函 数 将 其 转换 为 人 们 可 读 的 
时 间 和 日 期 。 图 6-1 说 明了 各 种 时 间 函 数 之 间 的 关系 。( 图 中 以 虚线 表示 的 四 个 函数 1ocaltime、 
mktime、ctime 和 strftime 都 受到 环境 变量 TZ 的 影响 。 我 们 将 在 本 节 后 面 对 其 进行 说 明 。) 





图 6-! 各 个 时 间 函 数 之 间 的 关系 


两 个 函数 1ocaltime 和 gmtime 将 日 历时 间 转 换 成 以 年 、 月 、 日 、 时 、 分 、 秒 、 周 日 表示 
的 时 间 ， 并 将 这 些 存放 在 一 个 tm 结构 中 。 


Struct tm { /* a broken-down time */ 
int tm sec; /* seconds after the minute: [0 - 60] */ 
int tm min; /* minutes after the hour: [0 - 59] */ 


int tm hour; /* hours after midnight: [0 - 23] */ 

int tm mday; /* day of the month: [1 - 31] */ 

int tm mon; /* months since January: [O - 11] */ 

int tm year; /* years since 1900 */ 

int tm wday; /* days since Sunday: [0 - 6] */ 

int tm yday; /* days since January 1: [0 - 365] */ 

int tm isdst; /* daylight saving time flag: «0, 0, >0 */ 


jn 


秒 可 以 超过 59 的 理由 是 可 以 表示 润 秒 。 注 意 ， 除 了 月 日 字段 ， 其 他 字段 的 值 都 以 0 开始 。 
如 果 夏 时 制 生效 ， 则 夏 时 制 标志 值 为 正 ， 如 果 为 非 夏 时 制 时 间 ， 则 该 标志 值 为 0， 如 果 此 信息 
不 可 用 ， 则 其 值 为 负 。 


Single UNIX Specification 以 前 的 版 本 克 许 双 润 秒 ， 于 是 ，tm_sec 值 的 有 效 范围 是 0 一 61。UTC 的 
正式 定义 不 允许 双 润 秒 ， 所 以 ， 现 在 tm_sec 值 的 有 将 范围 定义 为 0 一 60。 


! 
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#include <time.h> 


struct tm *gmtime(const time t *calpir); 


struct tm *localtime(const time t *calpir); 


两 个 函数 返回 值 : 指向 tm 结构 的 指针 





localtime 和 gmtime 之 间 的 区 别 是 ，localtime 将 日 历时 间 转 换 成 本 地 时 间 (考虑 到 本 地 
时 区 和 夏 时 制 标 志 )， 而 gmtime 则 将 日 历时 间 转 换 成 国际 标准 时 间 的 年 、 月 、 日 、 时 、 分 、 秒 、 
周 日 。 

函数 mktime 以 本 地 时 间 的 年 、 月 、 日 等 作为 参数 ， 将 其 转换 成 time_t 值 。 


#include <time.h> 
time t mktime(struct tm *imptr) ; 
BEE: 车 成 功 则 返回 日 历时 间 ， 若 出 错 则 返回 -1 


asctime 和 ctime 函 数 产 生 大 家 都 熟悉 的 26 字 节 的 字符 串 ， 这 与 4ate(1) 命 令 的 系统 默认 
输出 形式 类 似 ， 例 如 : 


Tue Feb 10 18:27:38 2004\n\0 





#include <time.h> 
char *asctime(const struct tm *imptr); 
char *ctime(const time t *calptr) ; 


两 个 函数 返回 值 ， 指 向 以 null 结 尾 的 字符 捉 的 指针 


asctime 的 参数 是 指向 年 、 月 、 日 等 字符 串 的 指针 ， 而 ctime 的 参数 则 是 指向 日 历时 间 的 指针 。 
最 后 一 个 时 间 函 数 是 strftime， 它 是 非常 复杂 的 类 似 于 printf 的 时 间 值 函数 。 





#include <time.h> 


size t strftime(char *restrict buf, size t maxsize, 
const char *restrict format, 
const struct tm *restrict tmptr) ; 


返回 值 : 若 有 空间 则 返回 存 人 数组 的 字符 数 ， 否 则 返回 0 


最 后 一 个 参数 是 要 格式 化 的 时 间 值 ， 由 一 个 指向 tm 结构 的 指针 指定 。 格 式 化 结果 存放 在 一 
个 长 度 为 maxsize 个 字符 的 buf 数 组 中 ， 如 果 buf 长 度 足 以 存放 格式 化 结果 及 一 个 null 终 止 符 ， 则 
该 函数 返回 在 buf 中 存放 的 字符 数 (不 包括 null 终 止 符 )， 否 则 该 函数 返回 0。 

format 参 数控 制 时 间 值 的 格式 。 如 同 printf 函 数 一 样 ， 转 换 说 明 的 形式 是 百 分 号 之 后 跟 
一 个 特定 字符 。format 中 的 其 他 字符 则 按 原样 输出 。 两 个 连续 的 百 分 号 在 输出 中 产生 一 个 百 分 
号 。 与 printf 函 数 不 同 的 是 ， 每 个 转换 说 明 产生 一 个 不 同 的 定 长 输出 字符 串 ， 在 format 字 符 
串 中 没有 字段 宽度 修饰 符 。 表 6-7 中 列 出 了 37 种 ISO C 规 定 的 转换 说 明 。 表 中 第 三 列 的 数据 来 自 
于 在 Linux 中 执行 strftime 函 数 所 得 的 结果 ， 它 对 应 的 时 间 和 日 期 是 Tue Feb 10 18:27:38 
EST 2004, 
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表 6-7 strftime 的 转换 说 阴 


缩写 的 周 日 名 

全 周 日 名 

缩写 的 月 名 

全 月 名 

日 期 和 时 间 

年 /100: [00-99] 

月 日 : [01 —31] 

H H [MM/DD/YY] 

月 日 (一 位 数 前 加 空格 ): [1-31] 
ISO 8601 日 期 格式 [YYYY-MM-DD] 
ISO 8601 基 于 周 的 年 的 最 后 2 位 数 [00~99] 
ISO 8601 基 于 周 的 年 

与 %b 相 同 

小 时 〈(24 时 制 ): [00 ~ 23] 
小 时 (12 时 制 ): [01 ~ 12] 
年 日 : [001 ~366] 

B: (01— 12] 

4: [00—59] 

换行 符 

AM/PM 

本 地 时 间 : (120 Hill) 

与 “%H:%M” 相同 

fb. [00~ 60] 

水 平 制 表 符 

与 “%H:%M:%S” 相 同 

ISO 8601 周 日 [Monday=1, 1-7] 
星期 日 周 数 : [00~ 53] 

ISO 8601 周 数 : [01 ~ 53] 

周 日 : [0=Sunday, 06] 
星期 一 周 数 ， [00 ~53] 

日 期 

时 间 

年 的 最 后 两 位 数 ， [00— 99] 

年 

ISO 8601 格 式 的 UTC 偏 移 量 
时 区 名 

转换 为 1 个 % 





Tuesday 
Feb 
February 
Tue Feb 10 18:27:38 2004 
20 

10 
02/10/04 
10 
2004-02-10 
04 

2004 

Feb 

18 

06 

041 

02 

27 


PM 

06:27:38 PM 
18:27 

38 


18:27:38 


02/10/04 
18:27:38 
04 

2004 
-0500 
EST 

多 





表 6-7 中 的 大 多 数 格式 说 明 的 意义 很 明显 。 需 要 略 作 解 释 的 是 SU、#V 和 $#W。s0U 是 相应 日 期 
在 该 年 中 所 属 周 数 ， 包 含 该 年 中 第 一 个 星期 日 的 周 是 第 一 周 。%W 也 是 相应 日 期 在 该 年 中 所 属 的 
周 数 ， 不 同 的 是 包含 第 一 个 星期 一 的 周 为 第 一 周 。%V 说 明 符 则 与 上 述 两 者 有 较 大 区 别 。 若 某 周 
包含 了 1 月 1 日 ， 而 且 至 少 包含 了 其 后 的 另外 3 天 ， 那 么 该 周 是 一 年 中 的 第 一 周 ， 否 则 该 周 被 认 
为 是 上 一 年 的 最 后 一 周 。 在 这 两 种 情况 下 ， 周 一 都 被 视 作 每 周 的 第 一 天 。 
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如 同 printf，strftime 对 某 些 转换 说 明 支 持 修饰 符 。 可 以 使 用 E 和 o 修 饰 符 产生 本 地 支 
持 的 另 一 种 格式 。 


某 些 系统 对 strftime 的 烙 式 字符 串 提 供 另外 一 些 非 标准 的 扩充 支持 。 


我 们 曾 在 前 面 提 及 ， 图 6-1 中 以 虚线 表示 的 四 个 函数 受到 环境 变量 TzZ 的 影响 。 这 四 个 函数 
Æ: localtime、mktime、ctime 和 strftime。 如 果 定 义 了 Tz， 则 这 些 函 数 将 使 用 其 值 以 
代替 系统 默认 时 区 。 如 果 TZ 定 义 为 空 串 ( 即 TZ=)， 则 使 用 国际 标准 时 间 UTC。Tz 的 值 常常 类 
(UF: TZ-ESTSEDT, 但 是 POSIX.1 允 许 更 详细 的 说 明 。 有 关 TzZ 变 量 的 详细 情况 ， 请 参阅 
Single UNIX Specification [Open Group 2004] 中 的 环境 变量 章节 。 


除 gettimeofday 函 数 外 ， 本 节 所 述 的 其 他 所 有 时 间 和 日 期 函数 都 是 由 ISO C 标 准 定义 的 。 在 此 基 
础 上 ，POSIX.1 增 加 了 环境 变量 TZ。 在 FreeBSD 5.2.1, Linux 2.4.22 和 Mac OS X 10.3 中 ， 关 于 TZ 变量 的 
更 多 信息 可 参见 手册 页 tzset(3)， 在 Solaris 9 中 ,可 和 参见 手册 页 environ(5)。 


6.11 人 小结 


所 有 UNIX 系 统 都 使 用 口令 文件 和 组 文件 。 我 们 说 明了 读 这 些 文件 的 各 种 函数 。 本 章 也 介 
绍 了 阴影 口令 ， 它 可 以 增加 系统 的 安全 性 。 附 加 组 ID 提供 了 一 个 用 户 同 时 可 以 参加 多 个 组 的 方 
法 。 我 们 还 介绍 了 大 多 数 系统 所 提供 的 存 取 其 他 与 系统 有 关 数 据 文件 的 类 似 函 数 。 我 们 讨论 了 
几 个 系统 标识 函数 ， 应 用 程序 使 用 它们 以 标识 它 在 何 种 系统 上 运行 。 最 后 ， 说 明了 ISO CH 
Single UNIX Specification 提 供 的 与 时 间 和 日 期 有 关 的 一 些 函 数 。 


38 

6.1 如 果 系 统 使 用 阴影 文件 ， 那 么 如 何 取得 加 密 口 令 ? 

62 假设 你 有 超级 用 户 权 限 ， 并 且 系 统 使 用 了 阴影 口令 ， 重 新 考虑 上 一 道 习题 。 

63 编写 一 个 程序 ， 它 调用 uname 并 输出 utsname 结 构 中 的 所 有 字段 ， 将 该 输出 与 uname(]) 
命令 的 输出 结果 作 比 较 。 

64 计算 可 由 time_t 数 据 类 型 表示 的 最 迟 时 间 。 如 果 超 出 了 这 一 时 间 将 会 如 何 ? 

65 编写 一 个 程序 ， 获 取 当前 时 间 ， 并 使 用 strftime 将 输出 结果 转换 为 类 似 于 date(1) 命 令 
的 默认 输出 。 将 环境 变量 Tz 设置 为 不 同 的 值 ， 观 察 输出 结果 。 
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7:1 引言 


下 一 章 将 介绍 进程 控制 原 语 ， 在 此 之 前 需 先 了 解 进 程 的 环境 。 本 章 中 将 学 习 : 当 执 行程 序 
时 ， 其 main 函 数 是 如 何 被 调用 和 的 ， 命令 行 参数 是 如 何 传送 给 执行 程序 的 ， 典 型 的 存储 器 布局 
是 什么 样式 ， 如 何 分 配 男 外 的 存储 空间 ， 进 程 如 何 使 用 环境 变量 ， 各 种 不 同 的 进程 终止 方式 
等 。 另 外 ， 还 将 说 明 1ongjmp 和 setjmp 函 数 以 及 它们 与 栈 的 交互 作用 。 本 章 结束 之 前 ， 还 将 
研究 进程 的 资源 限制 。 


7.2 main 函 数 
C 程 序 总 是 从 main 函 数 开始 执行 。main 限 数 的 原型 是 


int main(int argc, char *argv[]); 
其 中 ，argc 是 命令 行 参 数 的 数目 ，argv 是 指向 参数 的 各 个 指针 所 构成 的 数组 。7.4 节 将 对 命令 行 
参数 进行 说 明 。 

当 内 核 执 行 C 程 序 时 (使 用 一 个 exec 函 数 ，8.10 节 将 说 明 exec 函 数 )， 在 调用 main 前 先 调 
用 一 个 特殊 的 启动 例 程 。 可 执行 程序 文件 将 此 启动 例 程 指定 为 程序 的 起 始 地 址 一 一 这 是 由 连接 
编辑 器 设置 的 ， 而 连接 编辑 器 则 由 C 编 译 器 (通常 是 cc) 调用 。 启 动 例 程 从 内 核 取得 命令 行 参 
数 和 环境 变量 值 ， 然 后 为 按 上 述 方式 调用 main 函 数 做 好 安排 。 


7.3 进程 终止 


有 8 种 方式 使 进程 终止 (termination) ， 其 中 5 种 为 正常 终止 ， 它 们 是 
(1) 从 main 返 回 。 

(2) 调用 exit。 

(3) 调用 _exit 或 _Exit。 

(4) 最 后 一 个 线程 从 其 启动 例 程 返回 (11.5 节 )。 

(5) 最 后 一 个 线程 调用 pthread_exit (11.54) 
异常 终止 有 3 种 方式 ， 它 们 是 

(6) 调用 abort (10.1735), 

C) 接 到 一 个 信号 并 终止 (10.275). 

(8) 最 后 一 个 线程 对 取消 请 求 做 出 响应 (11.5 节 和 12.7 节 )。 


在 第 11 和 12 章 讨论 线程 之 前 ， 我 们 暂 不 考虑 专门 针对 线程 的 三 种 终止 方 式 。 
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上 一 节 提 及 的 启动 例 程 是 这 样 编写 的 ， 使 得 从 main 返 回 后 立即 调用 exit 函 数 。 如 果 将 启 
动 例 程 以 C 代 码 形式 表示 (实际 上 该 例 程 常常 用 汇编 语言 编写 )， 则 它 调用 main 函 数 的 形式 可 
能 是 : 

exit (main (argc, argv)); 

1. exit mH 

有 三 个 函数 用 于 正常 终止 一 个 程序 ，_exit 和 _Exit 立 即 进入 内 核 ，exit 则 先 执 行 一 些 
清理 处 理 (包括 调用 执行 各 终止 处 理 程序 ， 关 闭 所 有 标准 1O 流 等 )， 然 后 进入 内 核 。 


#include <stdlib.h> 





void exit (int status); 
void _Exit (int status) ; 


#include <unistd.h> 





void _exit (int status) ; 


我 们 将 在 8.5 节 中 讨论 这 三 个 函数 对 其 他 进程 〈 例 如 正在 终止 进程 的 父 、 子 进程 ) 的 影响 。 
使 用 不 同 头 文件 的 原因 是 : exit 和 _Exit 是 由 ISO C 说 明 的 ， 而 _exit 则 是 由 POSIX.1 说 明 的 。 


由 于 历史 原因 ，exit 函 数 总 是 执行 一 个 标准 MO 库 的 清理 关闭 操作 : 为 所 有 打开 流 调 用 
fclose 函 数 。 回 忆 5.5 节 ， 这 会 造成 所 有 缓冲 的 输出 数据 都 被 中 洗 ( 写 到 文件 上 )。 

三 个 exit 函 数 都 带 一 个 整 型 参数 ， 称 之 为 终止 状态 (或 退出 状态 ，exit status)。 大 多 数 
UNIX shell 都 提供 检查 进程 终止 状态 的 方法 。 如 果 (a) 若 调用 这 些 函数 时 不 带 终 止 状态 ,或 
(bjmain 执 行 了 一 个 无 返回 值 的 return 语 句 ， 或 (c)main 没 有 声明 返回 类 型 为 整 型 ， 则 该 进程 
的 终止 状态 是 未 定义 的 。 但 是 ， 若 main 的 返回 类 型 是 整 型 ， 并 且 main 执 行 到 最 后 一 条 语句 时 
返回 ( 隐 式 返回 )， 那 么 该 进程 的 终止 状态 是 0。 


这 种 处 理 是 ISO CH 21999 2| A69, 5 3 E, F$mainkKALHAA LAR Mreturn#y AB 
用 exit 函 数 ， 那 么 进程 的 终止 状态 是 未 定义 的 。 


main 靖 数 返 回 一 整 型 值 与 用 该 值 调用 exit 是 等 价 的 。 于 是 在 main 函 数 中 
exit (0); 


等 价 于 


return (0); 
实例 
程序 请 单 7-1 中 的 程序 是 经 典 的 “hello，world” 实 例 。 
程序 清单 7-1 经 典 的 C 程 序 





#include <stdio.h> 
main ({) 
printf("hello, world\n"); 


nm 
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对 该 程序 进行 编译 ， 然 后 运行 ， 则 可 见 到 其 终止 码 是 随机 的 。 如 果 在 不 同 的 系统 上 编译 该 
程序 ， 我 们 很 可 能 得 到 不 同 的 终止 码 ， 这 取决 于 main 函 数 返回 时 栈 和 寄存 器 的 内 容 : 

$ cc hello.c 

$ ./a.out 

hello, world 

$ echo $? 打印 终 下 状态 

13 


现在 ， 如 果 我 们 启用 1999 ISO C 编 译 器 扩展 ， 则 可 见 到 终止 码 改变 了 : 


$ cc -std-c99 hello.c 启用 gcc's 1999 ISO CH ke 
hello.c:4: warning: return type defaults to ^int^ 
$ ./a.out 

hello, world 

$ echo $? 打印 终止 状态 


0 


注意 ， 当 我 们 启用 1999 ISO C 扩 展 时 ， 编 译 器 发 出 警告 消息 。 打 印 该 警告 消息 的 原因 是 : mainh 
数 的 类 型 没有 显 式 地 声明 为 整 型 。 如 果 我 们 增加 了 这 一 声明 ， 那 么 此 警告 消息 就 不 会 出 现 。 但 是 ， 如 
果 我 们 启用 编译 器 所 推荐 的 警告 消息 〈 使 用 -Wall 标志 )， 则 可 能 见 到 类 似 于 “control reaches end of 
nonvoid function.” 控 制 到 达 非 void 函数 的 尾 端 这 样 的 警告 消息 。 

将 main 上 声明 为 返回 整 型 ， 但 在 main 函 数 体 内 用 exit 代 替 return， 对 某 些 C 编 译 器 和 UNIX 
1int(1) 程 序 而 言 会 产生 不 必要 的 警告 信息 ， 因 为 这 些 编译 器 并 不 知道 main 中 的 exit 与 Feturn 语 向 的 
作用 相同 。 避 开 这 种 警告 信息 的 一 种 方法 是 : 在 main 中 使 用 return 语 名 而 不 是 exit。 但 是 这 样 做 的 
结果 是 不 能 用 UNIX 的 grep 实 用 程序 来 找 出 程序 中 所 有 的 exit 调 用 。 另 外 一 个 解决 方案 是 将 maimn 声 明 
为 返回 void 而 不 是 int， 然 后 仍旧 调用 exit。 这 也 避 开 了 编译 器 的 警告 ， 但 从 程序 设计 角度 看 却 并 不 
正确 ， 而 且 会 产生 其 他 的 编译 警告 ， 因 为 ma 训 D 的 返回 类 型 应 当 是 带 符号 整 型 。 本 章 将 main 表 示 为 返回 
整 型 ， 因 为 这 是 ISO C 和 POSIX.1 所 指 义 的 。 

不 同 的 编译 器 所 发 生 警 告 消息 的 喝 哑 程度 是 不 一 样 的 。 除 非 使 用 警告 选项 ,否则 GNU C 编 译 器 通 
常 不 会 发 出 不 必要 的 警告 消息 。 口 


在 下 一 章 ， 我 们 将 了 解 到 任 一 进程 如 何 引 起 一 个 程序 被 执行 ， 如 何等 待 进程 完成 ， 然 后 又 
如 何 取 其 终止 状态 。 

2. atexit 函 数 

按照 ISO C 的 规定 ， 一 个 进程 可 以 登记 多 达 32 个 函数 ， 这 些 函 数 将 由 exit 自 动 调用 。 我 们 
称 这 些 函 数 为 终止 处 理 程 序 (exit handler) ， 并 调用 atexit 函 数 来 登记 这 些 函 数 。 


#include «stdlib.h» 


int atexit (void (*func) (void) ) ; 


返回 值 : 车 成 功 则 返回 9， 车 出 错 则 返回 非 0 值 
其 中 ，atexit 的 参数 是 一 个 函数 地 址 ， 当 调用 此 函数 时 无 需 向 它 传 送 任 何 参 数 ， 也 不 期 望 它 
返回 一 个 值 。exit 调 用 这 些 函 数 的 顺序 与 它们 登记 时 候 的 顺序 相反 。 同 一 函数 如 若 登 记 多 次 ， 
则 也 会 被 调用 多 次 。 
终止 处 理 程序 这 一 机 制 是 由 ANSI C 标 准 于 1989 年 引入 的 。 在 ANSI C 之 前 出 现 的 系统 〈 例 如 SVR3 


和 4.3BSD) 都 没有 提供 这 些 终止 处 理 程序 。 
ISO C 要 求 系统 至 少 应 支持 32 个 终止 处 理 程序 。 为 了 确定 一 个 给 定 的 平台 支持 的 景 大 终止 处 理 程 


bbs.theithome.com 








150 第 7 章 进程 环境 


序数 ， 可 以 使 用 sysconf 函 数 (3542-12), 


根据 ISO C 和 POSIX.1，exit 首 先 调用 各 终止 处 理 程序 ， 然 后 按 需 多 次 调用 fclose， 关 闭 
所 有 打开 流 。POSIX.1 扩 展 了 ISO_C 标 准 ， 它 指定 如 车程 序 调用 exec 函 数 族 中 的 任 一 函数 ， 则 
将 清除 所 有 已 安装 的 终止 处 理 程序 。 图 7-1 显 示 了 一 个 C 程 序 是 如 何 启动 的 ， 以 及 它 可 以 终止 的 
各 种 方式 。 








图 7-1 一 个 C 程 序 是 如 何 启动 和 终止 的 


注意 ， 内 核 使 程序 执行 的 唯一 方法 是 调用 一 个 exec 函 数 。 进 程 自愿 终止 的 唯一 方法 是 显 
式 或 隐 式 地 (通过 调用 exit) 调用 _exit 或 _Exit。 进 程 也 可 非 自愿 地 由 一 个 信号 使 其 终止 
183| 《图 7-1 中 设 有 显示 ) 。 


程序 清单 7-2 中 的 程序 说 明 如 何 使 用 atexit 函 数 。 
程序 清单 7-2 终止 处 理 程序 实例 
#include "apue.h" 


static void my exitl (void); 
static void my exit2 (void); 


int 
main (void) 


if (atexit(my exit2) != 0) 
err sys("can't register my exit2"); 
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if (atexit(my exitl1) != 0) 
err sys("can't register my exitl1"); 
if (atexit(my exitl) != 0) 


err sys("can't register my exit1"); 


printf ("main is done\n"); 
return(0); 


) 


static void 
my exitl(void) 


printf("first exit handler\n") ; 


) 


Static void 
my exit2 (void) 


printf ("second exit handler\n") ; 


执行 该 程序 产生 : 


$ ./a.out 

main is done 

first exit handler 
first exit handler 
second exit handler 


终止 处 理 程序 每 登记 一 次 ， 就 会 被 调用 一 次 。 在 程序 清单 7-2 中 ， 第 一 个 终止 处 理 程序 被 登记 两 
次 ， 所 以 也 会 被 调用 两 次 。 注 意 ， 在 main 中 没有 调用 exit， 而 是 用 了 return 语 句 。 口 
7.4 命令 行 参 数 

当 执行 一 个 程序 时 ， 调 用 exec 的 进程 可 将 命令 行 参数 传递 给 该 新 程序 。 这 是 UNIX shell fy 
一 部 分 常规 操作 。 在 前 几 章 的 很 多 实例 中 ， 我 们 已 经 看 到 了 这 一 点 。 
实例 

程序 清单 7-3 中 的 程序 将 其 所 有 命令 行 参数 都 回 送 到 标准 输出 上 。 注 意 ， 通 常 的 echo (1) 
程序 不 会 回 送 第 0 个 参数 。 

程序 清单 7-3 将 所 有 命令 行 参数 回 送 到 标准 输出 


#include "apue.h" 


int 
main(int argc, char *argv{]} 
{ 
int i; 
for (i = 0; i « argc; i++) /* echo all command-line args */ 
printf ("argv[%d]: %s\n", i, argv[il); 
exit (0); 
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如 果 编 译 该 程序 并 将 可 执行 文件 命名 为 echoarg， 则 得 到 


$ ./echoarg argl TEST foo 
argv[0]: ./echoarg 
argv[i]: argi 

argv[2]: TEST 

argv[3]: foo 


ISO C 和 POSIX.1 都 要 求 argv [argc] 是 一 个 空 指针 。 这 就 使 我 们 可 以 将 参数 处 理 循环 改写 为 





for (i = 0; argv[i] != NULL; i++) 


7.5 环境 表 


每 个 程序 都 会 接收 到 一 张 环 境 表 。 与 参数 表 一 样 ， 环 境 表 也 是 一 个 字符 指针 数组 ， 其 中 每 
个 指针 包含 一 个 Binul 结 束 的 C 字 符 串 的 地 址 。 全 局 变量 environ 则 包含 了 该 指针 数组 的 地 址 : 

extern char **environ; 
例如 ， 如 果 该 环境 包含 5 个 字符 串 ， 那 么 它 看 起 来 可 能 如 图 7-2 所 示 。 其 中 ， 每 个 字符 串 的 结尾 
处 都 显 式 地 有 一 个 null 字 符 。 我 们 称 environ 为 环境 指针 (environment pointer) ， 指 针 数 组 为 环 
境 表 ， 其 中 各 指针 指向 的 字符 串 为 环境 字符 申 。 

环境 指针 环境 表 环境 字符 串 
environ: HOME=/home/sar\0 

PATH=: /bin:/usr/bin\0 
SHELL=/bin/bash\0 
USER=sar\0 


LOGNAME=sar\ 0 





NULL 


图 7-2 由 5 个 C 字 符 串 组 成 的 环境 
按照 惯例 ， 环 境 由 


name=value 
这 样 的 字符 串 组 成 ， 这 与 图 7-2 中 所 示 相 同 。 大 多 数 预定 义 的 名 字 完 全 由 大 写字 母 组 成 ， 但 这 只 
是 一 个 惯例 。 


在 历史 上 ， 大 多 数 UNIX 系 统 支持 main 函 数 带 有 三 个 参数 ， 其 中 第 三 个 参数 就 是 环境 表 的 
地 址 : 


int main(int argc, char *argu[], char *envp[]); 


因为 ISO C 规 定 main 函 数 只 有 两 个 参数 ， 而 且 第 三 个 参数 与 全 局 变量 environ 相 比 也 没有 
带 来 更 多 益处 ， 所 以 POSIX.1 也 规定 应 使 用 environ 而 不 使 用 第 三 个 参数 。 通 常用 ge tenv 和 
putenv 函 数 ( 见 7.9 节 ) 来 访问 特定 的 环境 变量 ， 而 不 是 用 environ 变 量 。 但 是 ， 如 果 要 查看 
整个 环境 ， 则 必须 使 用 environ 指 针 。 


7.6 C 程 序 的 存储 空间 布局 
从 历史 上 讲 ，C 程 序 一 直 由 下 面 几 部 分 组 成 
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“正文 段 。 这 是 由 CPU 执行 的 机 器 指令 部 分 。 通 常 ， 正 文 段 是 可 共享 的 ， 所 以 即使 是 频繁 

执行 的 程序 (如 文本 编辑 器 、C 编 译 器 和 shell 等 ) 在 存储 器 中 也 只 需 有 一 个 副本 ， 另 外 ， 

正文 段 常常 是 只 读 的 ， 以 防止 程序 由 于 意外 而 修改 其 自身 的 指令 。 

* 初始 化 数据 段 。 通 常 将 此 段 称 为 数据 段 ， 它 包含 了 程序 中 需 明确 地 赋 初 值 的 变量 。 例 如 ， 

C 程 序 中 出 现在 任何 函数 之 外 的 声明 : 

int maxcount = 99; 

使 此 变量 带 有 其 初 值 存放 在 初始 化 数据 段 中 。 

* 非 初始 化 数据 段 。 通 常 将 此 段 称 为 bss 段 ， 这 一 名 称 来 源 于 一 个 早期 的 汇编 运算 符 ， 意 思 

是 “block started by symbol”( 由 符号 开始 的 块 )， 在 程序 开始 执行 之 前 ， 内 核 将 此 段 中 的 

数据 初始 化 为 0 或 空 指针 。 出 现在 任何 函数 外 的 C 声 明 

long sum[1000]; 

使 此 变量 存放 在 非 初 始 化 数据 段 中 。 

。 栈 。 自 动 变量 以 及 每 次 函数 调用 时 所 需 保存 的 信息 都 存放 在 此 段 中 。 每 次 调用 函数 时 ， 

其 返回 地 址 以 及 调用 者 的 环境 信息 (例如 某 些 机 器 寄存 器 的 值 ) 都 存放 在 栈 中 。 然 后 ， 

最 近 被 调用 的 函数 在 栈 上 为 其 自动 和 临时 变量 分 配 存 储 空间 。 通 过 以 这 种 方式 使 用 栈 ， 

可 以 递归 调用 C 国 数 。 递 归 函 数 每 次 调用 自身 时 ， 就 使 用 一 个 新 的 栈 帧 ， 因 此 一 个 函数 调 

用 实例 中 的 变量 集 不 会 影响 另 一 个 函数 调用 实例 中 的 变量 。 

“ 堆 。 通 常 在 堆 中 进行 动态 存储 分 配 。 由 于 历史 上 形成 的 惯例 ， 堆 位 于 非 初始 化 数据 段 和 

栈 之 间 。 

图 7-3 显 示 了 这 些 段 的 一 种 典型 安排 方式 。 这 是 程序 的 逻辑 布局 ， 虽 然 并 不 要 求 一 个 具体 实 
现 一 定 以 这 种 方式 安排 其 存储 空间 ， 但 这 是 一 种 我 们 便于 说 明 的 典型 安排 。 对 于 x86 处 理 器 上 
的 Linux， 正 文 段 从 0x08048000 单 元 开始 ， 栈 底 则 在 0xc0000000 之 下 开始 (在 这 种 特定 结 
构 中 ， 栈 从 高 地 址 向 低地 址 方向 增长 )。 堆 顶 和 栈 底 之 间 未 用 的 虚 地 址 空间 很 大 。 

命令 行 参数 和 
环境 变量 


未 初始 化 由 exec 初 
的 数据 始 化 为 0 


初始 化 的 数据 | T 


文件 中 读 入 


图 7-3 典型 的 存储 器 安排 





a.out 中 还 有 若干 其 他 类 型 的 段 ， 例 如 ， 包 含 符号 表 的 段 、 包含 调试 信息 的 段 以 及 包含 动态 共享 
库 链 接 表 的 段 等 等 。 这 些 部 分 并 不 装载 到 进程 执行 的 程序 映像 中 。 
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从 图 7-3 还 可 注意 到 ， 未 初始 化 数据 段 的 内 容 并 不 存放 在 磁盘 上 的 程序 文件 中 。 其 原因 是 ， 
内 核 在 程序 开始 运行 前 将 它们 都 设置 为 0。 需 要 存放 在 程序 文件 中 的 段 只 有 正文 段 和 初始 化 数 
据 段 。 

size(1) 命 令 报 告 正文 段 、 数 据 段 和 bss 段 的 长 度 (单位 : 字 节 )。 例 如 ， 


$ size /usr/bin/cc /bin/sh 
text data bss dec hex filename 
79606 1536 916 82058 1408a /usr/bin/cc 
619234 21120 18260 658614 a0cb6 /bin/sh 


第 4 列 和 第 5 列 是 分 别 以 十 进 制 和 十 六 进 制 表示 的 三 个 段 的 总 长 度 。 


7.7 共享 库 


BUE, 大 多 数 UNIX 系 统 支 持 共享 库 。Armold [1986] 说 明了 系统 V 上 共享 库 的 一 个 早期 实现 ， 
Gingell 等 [1987] 则 说 明了 SunOS 上 的 另 一 个 实现 。 共 享 库 使 得 可 执行 文件 中 不 再 需要 包含 公用 
的 库 例 程 ， 而 只 需 在 所 有 进程 都 可 引用 的 存储 区 中 维护 这 种 库 例 程 的 一 个 副本 。 程 序 第 一 次 执 
行 或 者 第 一 次 调用 某 个 库 函数 时 ， 用 动态 链接 方法 将 程序 与 共享 库 函 数 相 链 接 。 这 减少 了 每 个 
可 执行 文件 的 长 度 , 但 增加 了 一 些 运行 时 间 开 销 。 这 种 时 间 开 和 销 发 生 在 该 程序 第 一 次 被 执行 时 ， 
或 者 每 个 共享 库 函 数 第 一 次 被 调用 时 。 共 享 库 的 另 一 个 优点 是 可 以 用 库 函 数 的 新 版 本 代替 老 版 
本 ， 而 无 需 对 使 用 该 库 的 程序 重新 连接 编辑 。( 假 定 参数 的 数目 和 类 型 都 没有 发 生 改 变 。) 

在 不 同 的 系统 中 ， 程 序 可 能 使 用 不 同 的 方法 说 明 是 否 要 使 用 共享 库 。 比 较 典 型 的 有 cc(]) 
和 1a(1) 命 令 的 选项 。 作 为 长 度 方面 发 生变 化 的 例子 ， 先 用 无 共享 库 方式 创建 下 列 可 执行 文件 
(经 典 的 hello .cc 程序)，; 


$ ce -static hellol.c 阻止 gcc 使 用 共享 库 
$ 18 -l a.out 
-rwxrwxr-x 1 sar 475570 Feb 18 23:17 a.out 
$ size a.out 
text data bss dec hex filename 


375657 3780 3220 382657 5d6c1 a.out 


如 果 编 译 此 程序 以 使 用 共享 库 ， 则 可 执行 文件 的 正文 和 数据 段 的 长 度 都 会 显著 减 小 ; 


$ ce hellol.c gcc 点 认 使 用 共享 库 
$ 1s -1 a.out 
~Ywxrwxr-x 1 sar 11410 Feb 18 23:19 a.out 
$ size a.out 
text data bss dec hex filename 
872 256 4 1132 46c a.out 
7.8 存储 器 分 配 


ISO C 说 明了 三 个 用 于 存储 空间 动态 分 配 的 函数 。 

(1) malloc。 分 配 指定 字 节 数 的 存储 区 。 此 存储 区 中 的 初始 值 不 确定 。 

(2) calloc。 为 指定 数量 具 指 定 长 度 的 对 象 分 配 存储 空间 。 该 空间 中 的 每 一 位 都 初始 化 
为 0。 


(3) realloc。 更 改 以 前 分 配 区 的 长 度 ( 增 加 或 减少 )。 当 增加 长 度 时 ， 可 能 需 将 以 前 分 配 
区 的 内 容 移 到 另 一 个 足够 大 的 区 域 ， 以 便 在 尾 端 提供 增加 的 存储 区 ， 而 新 增 区 域内 的 初始 值 则 
不 确定 。 





_bbs.theithome.com 


18 存储 器 分 配 155 





#include <stdlib.h> 


void *malloc(size t size); 


void *calloc(size t nobj, size t size); 


void *realloc(void *ptr, size t newsize) ; 


三 个 国 数 返回 值 : 若 成 功 则 返回 非 空 指针 ， 若 出 错 则 返回 NULL 


void free(void *ptr) ; 








这 三 个 分 配 函 数 所 返回 的 指针 一 定 是 适当 对 齐 的 ， 使 其 可 用 于 任何 数据 对 象 。 例 如 ， 在 一 个 特 
定 的 系统 上 ， 如 果 最 苛刻 的 对 齐 要 求 是 ，double 必 须 在 8 的 倍数 地 址 单元 处 开始 ， 那 么 这 三 个 
函数 返回 的 指针 都 应 这 样 对 齐 。 

因为 这 三 个 alloc 函 数 都 返回 通用 指针 void*， 所 以 如 果 在 程序 中 包括 了 #include 
<stdlib.h> (以 获得 函数 原型 ) ， 那 么 当 我 们 将 这 些 函 数 返 回 的 指针 赋予 一 个 不 同类 型 的 指 
针 时 ， 就 不 需要 显 式 地 执行 类 型 强制 转换 。 

函数 free 释 放 ptr 指 向 的 存储 空间 。 被 释放 的 空间 通常 被 送 入 可 用 存储 区 池 ， 以 后 ， 可 在 
调用 上 述 三 个 分 配 函 数 时 再 分 配 。 

realloc 沙 数 使 我 们 可 以 增 、 减 以 前 分 配 区 的 长 度 (最 常见 的 用 法 是 增加 该 区 ) 。 例 如 ， 
如 果 先 为 一 个 数组 分 配 存储 空间 ， 该 数组 长 度 为 512， 然 后 在 运行 时 填充 它 ， 但 运行 一 段 时 间 
后 发 现 该 数组 原先 的 长 度 不 够 用 ， 此 时 就 可 调用 realloc 扩 充 相 应 存储 空间 。 如 果 在 该 存储 区 
后 有 足够 的 空间 可 供 扩 充 ， 则 可 在 原 存储 区 位 置 上 向 高 地 址 方向 扩充 ， 无 需 移 动 任何 原先 的 内 
容 ， 并 返回 传送 给 它 的 同样 的 指针 值 。 如 果 在 原 存 储 区 后 没有 足够 的 空间 ， 则 realloc 分 配 另 
一 个 足够 大 的 存储 区 ， 将 现 有 的 512 个 元 素数 组 的 内 容 复 制 到 新 分 配 的 存储 区 。 然 后 ， 释 放 原 
存储 区 ， 返 回 新 分 配 区 的 指针 。 因 为 这 种 存储 区 可 能 会 移动 位 置 ， 所 以 不 应 当 使 任何 指针 指 到 
该 区 中 。 习 题 4.16 显 示 了 在 getcwd 中 如 何 使 用 realloc， 以 处 理 任何 长 度 的 路 径 名 。 程 序 清 
单 17-28 是 使 用 realloc 的 另 一 个 例子 ， 用 其 可 以 避免 使 用 编译 时 固定 长 度 的 数组 。 


注意 ，realloc 的 最 后 一 个 参数 是 存储 区 的 newsize (新 长 度 )， 它 不 是 新 、 旧 存储 区 长 度 
之 差 。 作 为 一 个 特例 ， 若 ptr 是 一 个 空 指针 ， 则 real1oc 的 功能 与 mal1loc 相 同 ， 用 于 分 配 一 个 


指定 长 E A jnewsize 的 存储 区 。 


这 些 函 数 的 早期 版 本 允许 调用 realloc 分 配 自 上 次 malloc、realloc 或 calloc 调 用 以 来 所 释放 
的 块 。 这 种 技巧 可 回溯 到 V7， 它 利用 malloc 的 搜索 策略 ， 实 现 友 储 器 紧缩 。Solaris 仍 支持 这 一 功能 ， 
而 很 多 其 他 平台 则 不 支持 。 这 种 功能 不 被 赞同 ， 不 应 再 使 用 。 


这 些 分 配 例 程 通常 用 sbrk(2) 系 统 调用 实现 。 该 系统 调用 扩充 (或 缩小 ) 进程 的 堆 ( 见 图 
7-3)。malloc 和 free 的 一 个 示例 实现 请 见 Kernighan 和 Ritchie [1988] 的 8.7 节 , 

虽然 sbrk 可 以 扩充 或 缩小 进程 的 存储 空间 ， 但 是 大 多 数 mal loc 和 free 的 实现 都 不 减 小 进 
程 的 存储 空间 。 释 放 的 空间 可 供 以 后 再 分 配 ， 但 通常 将 它们 保持 在 malloc 池 中 而 不 返回 给 内 核 。 

应 当 注 意 的 是 ， 大 多 数 实 现 所 分 配 的 存储 空间 比 所 要 求 的 要 稍 大 一 些 ， 额 外 的 空间 用 来 记 
录 管 理 信息 分 配 块 的 长 度 、 指 向 下 一 个 分 配 块 的 指针 等 等 。 这 就 意味 着 如 果 超 过 一 个 已 分 
配 区 的 尾 端 进行 写 操作 ， 则 会 重 写 后 一 个 块 的 管理 记录 。 这 种 类 型 的 错误 是 灾难 性 的 ， 但 是 因 
为 这 种 错误 不 会 很 快 暴露 出 来 ， 所 以 也 就 很 难 发 现 。 同 样 ， 在 已 分 配 区 起 始 位 置 之 前 进行 写 操 
作 会 重 写 本 块 的 管理 记录 。 
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在 动态 分 配 的 缓冲 区 前 或 后 进行 写 操作 ， 破 坏 的 可 能 不 仅仅 是 该 区 的 管理 记录 信息 。 在 动 
态 分 配 的 缓冲 区 前 后 的 存储 区 很 可 能 用 于 其 他 动态 分 配 的 对 象 。 这 些 对 象 与 破坏 它们 的 代码 可 
能 无 关 ， 这 造成 寻求 信息 破坏 的 源头 更 加 困难 。 

其 他 可 能 产生 的 致命 性 的 错误 是 : 释放 一 个 已 经 释放 了 的 块 ， 调 用 free 时 所 用 的 指针 不 
是 三 个 a11oc 函 数 的 返回 值 等 。 如 若 一 个 进程 调用 malloc 函 数 ， 但 却 忘记 调用 free 函 数 ， 那 
么 该 进程 占用 的 存储 器 就 会 连续 增加 ， 这 被 称 为 汇 汤 (leakage)。 不 调用 free 函 数 以 释放 不 再 
使 用 的 空间 ， 那 么 进程 地 址 空间 长 度 就 会 慢 慢 增 加 ， 直 至 不 再 有 空闲 空间 。 此 时 ， 由 于 过 度 的 
分 页 开销 ， 因 而 使 性 能 下 降 。 

因为 存储 器 分 配 出 错 很 难 跟踪 ， 所 以 某 些 系统 提供 了 这 些 函 数 的 另 一 种 实现 版 本 。 每 次 调 
用 这 三 个 分 配 函 数 中 的 任意 一 个 或 Eree 时 ， 它 们 都 进行 附加 的 检 错 。 在 调用 连接 编辑 器 时 指 
定 一 个 专用 库 ， 则 在 程序 中 就 可 使 用 这 种 版 本 的 函数 。 此 外 还 有 公共 可 用 的 资源 ， 在 对 其 进行 
编译 时 使 用 一 个 特殊 标志 就 会 使 附加 的 运行 时 检查 生效 。 


FreeBSD, Mac OS X 以 及 Linux 通 过 设置 环境 变量 ， 支 持 附加 的 调 斌 功能。 另外， 通过 符号 链接 
/etcVmalloc.conf， 可 将 选项 传递 给 FreeBSD 孔 数 库 。 


1. 替代 的 存储 器 分 配 程序 

有 很 多 可 替代 malloc 和 free 的 函数 。 某 些 系统 已 经 提供 替代 存储 器 分 配 函 数 的 库 。 另 一 
些 系 统 只 提供 标准 的 存储 器 分 配 程序 ， 如 果 希 望 ， 则 软件 开发 者 可 以 下 载 替代 函数 。 下 面 讨论 
某 些 替代 函数 和 库 。 

2. libmalloc 

基于 SVRV 的 UNIX 系 统 (例如 Solaries) 包括 1ibmalloc 库 ， 它 提供 了 一 套 与 1SO C 存 储 
器 分 配 函 数 相 匹 配 的 接口 。1ibmal1loc 库 包括 mal1lopt 函数， 它 使 进程 可 以 设置 一 些 变 量 ， 
并 用 它们 来 控制 存储 空间 分 配 程序 的 操作 。 还 可 使 用 另 一 个 名 为 mallinfo 的 函数 ， 以 对 存储 
空间 分 配 程序 的 操作 进行 统计 。 

3. vmalloc 

Vo[1996] 说 明 一 种 存储 器 分 配 程序 ， 它 允许 进程 对 于 不 同 的 存储 区 使 用 不 同 的 技术 。 除 了 
一 些 vmalloc 特 有 的 函数 外 ， 该 库 也 提供 了 ISO C 存 储 器 分 配 的 仿真 器 。 

4. 快速 适 配 (quick-fit) 

历史 上 ， 所 使 用 的 标准 mal1loc 算 法 是 最 佳 适 配 或 首次 适 配 存 储 分 配 策略 。 快 速 适 配 算法 
快 于 上 述 两 种 算 靶 ， 但 趋向 于 使 用 较 多 的 存储 器 。Weinstock 和 Wulf[1988] 对 该 算 靶 进行 了 描述 ， 
该 算法 基于 将 存储 器 分 裂 成 各 种 长 度 的 缓冲 区 , 并 将 未 使 用 的 缓冲 区 按 其 长 度 组 成 不 同 的 空闲 
区 列表 。 在 许多 ftp 网 站 上 可 方便 地 取 用 基于 快速 适 配 的 mal 1oc 和 free 开 放 源 代码 实现 。 

5. allocagyzy 

还 有 一 个 函数 也 值得 一 提 ， 这 就 是 alloca。 它 的 调用 序列 与 malloc 相 同 ， 但 是 它 是 在 当 
前 函数 的 栈 帧 上 分 配 存 储 空间 ， 而 不 是 在 堆 中 。 其 优点 是 : 当 函 数 返 回 时 ， 自 动 释放 它 所 使 用 
的 栈 帧 ， 所 以 不 必 再 为 释放 空间 而 费心 。 其 缺点 是 : alloca 函 数 增加 了 栈 帧 的 长 度 ， 而 其 些 
系统 在 函数 已 被 调用 后 不 能 增加 栈 帧 长 度 ， 于 是 也 就 不 能 支持 a11o0ca 函 数 。 尽 管 如 此 ， 很 多 
软件 包 还 是 使 用 al1loca 函 数 ， 也 有 很 多 系统 实现 了 该 函数 。 


本 书 中 讨论 的 四 个 平台 都 提供 了 alloca 函 数 。 
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7.9 环境 变量 
如 同 前 述 ， 环 境 字 符 串 的 形式 通常 如 下 ; 


name=value 


UNIX 内 核 并 不 查看 这 些 字符 串 ， 它 们 的 解释 完全 取决 于 各 个 应 用 程序 。 例 如 ，shell 使 用 了 大 
量 的 环境 变量 。 其 中 某 一 些 在 登录 时 自动 设置 (如 HOME、USER 等 )， 有 些 则 由 用 户 设置 。 我 
们 通常 在 一 个 shell 启 动 文件 中 设置 环境 变量 以 控制 sheli 的 动作 。 例 如 ， 若 设置 了 环境 变量 
MAILPATH， 则 它 告诉 Bourne shell, GNU Bourne-again shell 和 Korn shell 到 哪里 去 查看 邮件 。 
ISO C 定 义 了 一 个 函数 getenv， 可 以 用 其 取 环 境 变量 值 ， 但 是 该 标准 又 称 环境 的 内 容 是 由 


#include «<stdlib.h> 


char *getenv(const char *name) ; 


返回 值 ， 指 向 与 name 关 联 的 value 的 指针 ， 若 未 找到 则 返回 NULL 


注意 ， 此 函数 返回 一 个 指针 ， 它 指向 name = value 字 符 串 中 的 value。 我 们 应 当 使 用 getenv 从 环 
境 中 取 一 个 指定 环境 变量 的 值 ， 而 不 是 直接 访问 environ。 

Single UNIX Specification 中 的 POSIX.1 定 义 了 某 些 环境 变量 。 如 果 支 持 XSI 扩 展 ， 那 么 其 中 也 包 
含 了 另外 一 些 环境 变量 定义 。 表 7-1 列 出 了 由 Single UNIX Specification 定 义 的 环境 变量 ， 并 指明 本 书 
讨论 的 4 种 实现 对 它们 的 支持 情况 。 由 POSIX.1 定 义 的 各 环境 变量 标记 为 。， 否 则 为 XSI 扩 展 。 本 书 
讨论 的 4 种 UNIX 实 现 使 用 了 很 多 依赖 于 实现 的 环境 变量 。 注 意 ，ISO C 没 有 定义 任何 环境 变量 。 


表 7-1 Single UNIX Specification 定 义 的 环境 变量 





COLUMNS ry 1| 

DATEMSK getdate(3) BUB C HERR EE 
HOME . 起 始 目录 

LANG . 本 地 名 

DO. ALL . 本 地 名 

LC_COLLATE . 本 地 排序 名 

LC_CTYPE . 本 地 字符 分 类 名 

MESSAGES . 本 地 消息 名 

LC_MONETARY . 本 地 货币 编辑 名 

LC_NUMERIC . 本 地 数字 编辑 名 

LC_TIME . 本 地 日 期 /时 间 格 式 名 

LINES 。 终端 高 度 

LOGNAME . 登录 名 

MSGVERB fmtmsg(3) 处 理 的 消息 组 成 部 分 
NLSPATH 消息 类 模板 序列 

PATH . 搜索 可 执行 文件 的 路 径 前 组 列表 
PWD . 当前 工作 目录 的 绝对 路 径 名 
SHELL . 用 户 首选 的 shell 名 

TERM . 终端 类 型 

TMPDIR . 在 其 中 创建 临时 文件 的 目录 路 径 名 
TZ . 时 区 信息 
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除了 取 环 境 变量 的 值 ， 有 时 也 需要 设置 环境 变量 。 我 们 可 能 希望 改变 现 有 变量 的 值 ， 或 者 
增加 新 的 环境 变量 。( 在 下 一 章 将 会 了 解 到 ， 我 们 能 影响 的 只 是 当前 进程 及 调用 的 任何 子 进程 
的 环境 ， 但 不 能 影响 父 进程 的 环境 ， 这 通常 是 一 个 shell 进 程 。 尽 管 如 此 ， 修 改 环境 表 的 能 力 仍 
然 是 很 有 用 的 。) 不 幸 的 是 ， 并 不 是 所 有 系统 都 支持 这 种 能 力 。 表 7-2 列 出 了 由 不 同 的 标准 及 实 
现 支持 的 各 种 函数 。 


表 7-2 对 于 各 种 环境 表 函 数 的 支持 


ISOC . POSIX.1 | FreeBSD 5.2.1 Linux 2.4.22 MacOS X10.3 Solaris 9 


getenv 






putenv 






Setenv 







unsetenv 






Clearenv 


clearenv 4% Single UNIX Specification 的 组 成 部 分 。 它 被 用 来 删除 环境 表 中 的 所 有 项 。 
表 7-2 中 间 三 个 函数 的 原型 是 : 
#include <stdlib.h> 
int putenv(char *sér) ; 


int setenv(const char *name, const char *value, int rewrite) ; 


int unsetenv(const char *name) ; 


TARR EMA: A ATARI, FEE mikot 





这 三 个 函数 的 操作 是 : 
“PutenvV 取 形式 为 name = value 的 字符 串 ， 将 其 放 到 环境 表 中 。 如 果 mame 已 经 存在 ， 则 先 
删除 其 原来 的 定义 。 
。setenv 将 name 设 置 为 value。 如 果 在 环境 中 name 已 经 存在 ， 那 么 (a) 若 rewrite 非 0， 则 首 
先 删 除 其 现 有 的 定义 ，(b) 车 rewrite 为 0， 则 不 删除 其 现 有 定义 (name 不 设置 为 新 的 value， 
而 且 也 不 出 错 )。 
。unsetenv 删 除 name 的 定义 。 即 使 不 存在 这 种 定义 也 不 算出 错 。 


注意 putenv 和 setenv 之 间 的 差别 。setenv 必 须 分 配 存储 区 ， 以 便 依 据 其 参数 创建 name = value 
字符 事 。 同 时 ，putenv 则 无 需 将 传送 给 第 的 参数 字符 事 直 接 放 到 环境 中 。 确 实 ， 在 Linux 和 Solaris 中 ， 
putenv 实 现 将 传送 给 它 的 字符 事 地 址 作为 参数 直接 放 入 环境 表 中 。 在 过 种 情况 下 、 将 存放 在 栈 中 的 字 
符 事 作为 参数 传送 给 该 函数 就 会 发 生 错 误 ， 其 原因 是 ， 从 当前 函数 返回 时 ， 其 栈 题 占 用 的 存储 区 可 能 
RE A, 


这 些 函 数 在 修改 环境 表 时 是 如 何 进行 操作 的 呢 ? 对 这 一 问题 进行 研究 、 考 察 是 非常 有 益 的 。 
回忆 图 7-3， 其 中 ， 环 境 表 (指向 实际 name = value 字 符 串 的 指针 数组 ) 和 环境 字符 串通 常 存放 
在 进程 存储 空间 的 顶部 〈 栈 之 上 )。 删 除 一 个 字符 串 很 简单 一 一 只 要 先 在 环境 表 中 找到 该 指针 ， 
然后 将 所 有 后 续 指 针 都 向 环境 表 首 部 顺 次 移动 一 个 位 置 。 但 是 增加 一 个 字符 串 或 修改 一 个 现 有 

的 字符 串 就 困难 得 多 。 环 境 表 和 环境 字符 串通 常 占 用 的 是 进程 地 址 空间 的 顶部 ， 所 以 它 不 能 
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向 高 地 址 方向 〈 向 上 ) 扩展 ， 同 时 也 不 能 移动 在 它 之 下 的 各 栈 帧 ， 所 以 它 也 不 能 向 低地 址 方向 
(向 下 ) 扩展 。 两 者 组 合 使 得 该 空间 的 长 度 不 能 再 增加 。 
(1) 如 果 修 改 一 个 现 有 的 name: ， 
^ (a) 如 果 新 value 的 长 度 少 于 或 等 于 现 有 value 的 长 度 ， 则 只 要 在 原 字 符 串 所 用 空间 中 写 
入 新 字符 中 。 
(b) 如 果 新 value 的 长 度 大 干 原 长 度 ， 则 必须 调用 mal1oc 为 新 字符 串 分 配 空间 ， 然 后 将 
新 字符 串 复制 到 该 空间 中 ， 接 着 使 环境 表 中 针对 name 的 指针 指向 新 分 配 区 。 
(2) 如 果 要 增加 一 个 新 的 name ， 则 操作 就 更 加 复杂 。 首 先 ， 调 用 mal1oc 为 name = value 字 
符 串 分 配 空 间 ， 然 后 将 该 字符 串 复制 到 此 空间 中 ， 则 ; 
(a) 如 果 这 是 第 一 次 增加 一 个 新 aame， 则 必须 调用 mal1oc 为 新 的 指针 表 分 配 空 间 。 接 
着 ,将 原来 的 环境 表 复制 到 新 分 配 区 ， 并 将 指向 新 name = value 字 符 串 的 指针 存放 
在 该 指 针 表 的 表 尾 ， 然 后 又 将 一 个 空 指针 存放 在 其 后 。 最 后 使 environ 指 向 新 指针 
表 。 了 再 看 一 下 图 7-3， 如 果 原 来 的 环境 表 位 干 栈 顶 之 上 这 是 一 种 常见 情况 )， 那 么 
必须 将 此 表 移 至 堆 中 。 但 是 ， 此 表 中 的 大 多 数 指针 仍 指向 栈 顶 之 上 的 各 name = 
value 字 符 串 。 
(b) 如 果 这 不 是 第 一 次 增加 一 个 新 name ， 则 可 知 以 前 已 调用 malloc 在 堆 中 为 环境 表 分 
配 了 空间 ， 所 以 只 要 调用 realloc， 以 分 配 比 原 空 间 多 存放 一 个 指针 的 空 闻 。 然 后 
将 指向 新 name = value 字 符 串 的 指针 存放 在 该 表 表 尾 ， 后 面 跟着 一 个 空 指针 。 


7.10 setjmp 和 Longjmp 函 数 


在 C 中 ，goto 语 句 是 不 能 跨越 函数 的 ， 而 执行 这 类 跳 转 功 能 的 是 函数 setjmp 和 longjmp。 
这 两 个 函数 对 于 处 理发 生 在 深层 做 套子 数 调用 中 的 出 错 情况 是 非常 有 用 的 。 

考虑 程序 清单 7-4 的 骨架 部 分 。 其 主 循环 是 从 标准 输入 读 1 行 ， 然 后 调用 3o_1ine 处 理 该 输 
入 行 。4o_1ine 函 数 调用 get_token 从 该 输入 行 中 取 下 一 个 标记 。 一 行 中 的 第 一 个 标记 假定 
是 一 条 某 种 形式 的 命令 ， 于 是 switch 语 句 就 实现 命令 选择 。 我 们 的 程序 只 处 理 一 条 命令 
(add 命 令 )， 对 此 命令 调用 cmG_a96 函 数 。 

程序 清单 7-4 进行 命令 处 理 的 典型 程序 骨架 
#include "apue.h" 


#define TOK_ADD 5 


void do_line(char *); 
void emd_add (void) ; 
int get token (void) ; 


int 
main (void) 


char line (MAXLINE] ; 
while (fgets(line, MAXLINE, stdin) != NULL) 
do_line (line) ; 
exit (0); 
} 
char *tok ptr; /* global pointer for get token() */ 
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void 
do line(char *ptr) /* process one line of input */ 


int cmd; 


tok ptr = ptr; 

while ((cmd = get token()) > 0) { 
switch (cmd) ( /* one case for each command */ 
case TOK ADD: 


cmd add(); 
break; 
} 
} 
} 
void 
emd_add (void) 
int token; 


token = get_token(); 
/* rest of processing for this command */ 


} 
int 
get_token (void) 


/* fetch next token from line pointed to by tok_ptr */ 


} 


程序 清单 7-4 中 的 框架 典型 地 用 于 读 命令 ， 确 定 命令 的 类 型 ， 然 后 调用 相应 函数 处 理 每 一 条 
196| 命令 这 一 类 程序 。 图 7-4 显 示 了 调用 了 cmq_add 之 后 栈 的 大 致使 用 情况 。 


栈 的 底部 高 地 址 


main 的 栈 帧 


do_line 


的 栈 帧 


cmd_add 
BER 的 枝 相 
的 方向 | 低地 址 
图 7-4 调用 cmqa_aqadq 后 的 各 个 栈 帧 
自动 变量 的 存储 单元 在 每 个 函数 的 栈 帧 中 。 数 组 Line 在 main 的 栈 帧 中 ， 整 型 cmd 在 
do_line 的 栈 帧 中 ， 整 型 foken 在 cmdq_addq 的 栈 帧 中 。 
如 上 所 述 ， 这 种 形式 的 栈 安排 是 非常 典型 的 ， 但 并 不 要 求 非 如 此 不 可 。 栈 并 不 一 定 要 向 低 
地 址 方向 扩充 。 某 些 系统 对 栈 并 没有 提供 特殊 的 硬件 支持 ， 此 时 一 个 C 实 现 可 能 要 用 链接 表 实 
现 栈 帧 。 


在 编写 程序 清单 7-4 这 样 的 程序 时 经 常会 遇 到 的 一 个 问题 是 ， 如 何 处 理 非 致命 性 的 错误 。 例 
如 ， 若 cmd_add 函 数 发 现 一 个 错误 ( 壁 如 说 一 个 无 效 的 数 )， 那 么 它 可 能 先 打 印 一 个 出 错 消 息 ， 
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然后 希望 忽略 输入 行 的 余下 部 分 ， 返 回 main 函 数 并 读 下 一 输入 行 。 但 是 如 果 这 种 情况 出 现在 
main 呼 数 中 的 深层 修 套 中 时 ， 用 C 语 言 就 比较 难以 做 到 这 一 点 。( 在 本 例 中 ，cmG_ad6 函 数 只 
比 main 深 两 个 层次 ， 在 有 些 程序 中 往往 深 五 个 层次 或 更 多 。) 如 果 我 们 不 得 不 以 检查 返回 值 的 
方法 逐 层 返回 ， 那 就 会 变 得 很 麻烦 。 

解决 这 种 问题 的 方法 就 是 使 用 非 局 部 goto 一 一 setjmp 和 1ocngjmp 函 数 。 非 局 部 指 的 是 ， 
这 不 是 由 普通 C 语 言 goto 语 句 在 一 个 函数 内 实施 的 跳 转 ， 而 是 在 栈 上 跳 过 若干 调用 帧 ， 返 回 到 
当前 函数 调用 路 径 上 的 某 一 个 函数 中 。 

#include <setjmp.h> 


int setjmp(jmp_buf env); 





返回 值 : 车 直接 调用 则 返回 0， 若 从 1ongjmp 调 用 返回 则 返回 非 0 值 








void longjmp(jmp_buf env, int val); 





在 希望 返回 到 的 位 置 调用 setjmp， 在 本 例 中 ， 此 位 置 在 main 函 数 中 。 因 为 我 们 直接 调用 
该 函数 ， 所 以 其 返回 值 为 0。setjmp 参 数 env 的 类 型 是 一 个 特殊 类 型 jmp_buf。 这 一 数据 类 型 
是 某 种 形式 的 数组 ， 其 中 存放 在 调用 1ongjmp 时 能 用 来 恢复 栈 状态 的 所 有 信息 。 因 为 需 在 另 一 
个 函数 中 引用 env 变 量 ， 所 以 规范 的 处 理 方 式 是 将 env 变 量 定义 为 全 局 变量 。 

当 检 查 到 一 个 错误 时 ， 例 如 在 cmd_add 函 数 中 ， 则 以 两 个 参数 调用 1ongjmp 函 数 。 第 一 
个 就 是 在 调用 setjmp 时 所 用 的 exv， 第 二 个 参数 是 具有 非 0 值 的 val1， 它 将 成 为 从 setjmp 处 返 
回 的 值 。 使 用 第 二 个 参数 的 原因 是 对 于 一 个 setjmp 可 以 有 多 个 1ongjmp。 例 如 ， 可 以 在 
cmQ_add 中 以 val 为 1 调用 longjmp， 也 可 在 get_token 中 以 val 为 2 调用 1ongjmp。 在 main 函 
数 中 ，setjmp 的 返回 值 就 会 是 1 或 2， 通 过 测试 返回 值 就 可 判断 造成 返回 的 1ongjmp 是 在 
cmd_ad9 还 是 在 get_token 中 。 

再 回 到 程序 实例 中 ， 程 序 清单 7-5 给 出 了 经 修改 过 后 的 main 和 cm6_aG6 函 数 (另外 两 个 函 
数 ao_1ine 和 get_token 未 经 更 改 ) 。 


程序 清单 7-5 setjmp 和 longjmp 实 例 


#include "apue.h" 
#include <setjmp.h> 


#define TOK_ADD 5 
jmp_buf jmpbuffer; 
int 

main (void) 


char line [MAXLINE] ; 


if (setjmp(jmpbuffer) != 0) 
printf ("error") ; 

while (fgets(line, MAXLINE, stdin) != NULL) 
do line (line); 

exit (0); 
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void 
emd_add (void) 


int token; 


token = get_token(); 

if (token < 0) /* an error has occurred */ 
longjmp(jmpbuffer, 1); 

/* vest of processing for this command */ 


} 





执行 main 时 ， 调 用 setjmp ， 它 将 所 需 的 信息 记 和 人 变量 jmppuffer 中 并 返回 0。 然 后 调用 
do_line， 它 又 调用 cm_aqdda， 假 定 在 其 中 检测 到 一 个 错误 。 在 cmq_add 中 调用 longjmp 之 
前 ， 栈 的 形式 如 图 7-4 中 所 示 。 但 是 1ongjmp 使 栈 反 绕 到 执行 hain 函 数 时 的 情况 ， 也 就 是 抛弃 
了 cma_add 和 Go_1ine 的 栈 帧 ( 见 图 7-5)。 调 用 1ongjmp 造 成 main 中 setjmp 的 返回 , 但 是 ， 
这 一 次 的 返回 值 是 1 (1ongjmp 的 第 二 个 参数 )。 


栈 的 底部 高 地 址 
main 的 栈 帧 


RTR | 


的 方向 低地 址 


图 7-5 ”调用 1ongjmp 后 的 栈 帧 


1. 自动 、 寄 存 器 和 易 失 变量 

我 们 已 经 了 解 在 调用 1ongjmp 后 栈 帧 的 基本 结构 ， 下 一 个 问题 是 ， 在 main 范 数 中 ， 自 动 
变量 和 寄存 器 变量 的 状态 如 何 ? 当 1ongjmp 返 回 到 main 函 数 时 ， 这 些 变量 的 值 是 否 能 恢复 到 
以 前 调用 setjmp 时 的 值 ( 即 回 滚 到 原先 值 )， 或 者 这 些 变 量 的 值 保持 为 调用 do_1ine 时 的 值 
(do_line 调 用 cmG_aGd，cmd_add 又 调用 1ongjmp) ? 不 幸 的 是 ， 对 此 问题 的 回答 是 “看 
情况 ”"。 大 多 数 实现 并 不 回 滚 这 些 自 动 变量 和 寄存 器 变量 的 值 ， 而 所 有 标准 则 说 它们 的 值 是 不 
确定 的 。 如 果 你 有 一 个 自动 变量 ， 而 又 不 想 使 其 值 回 滚 ， 则 可 定义 其 为 具有 volatile 属 性 。 
声明 为 全 局 或 静态 变量 的 值 在 执行 1ongjmp 时 保持 不 变 。 





下 面 我 们 通过 程序 清单 7-6 说 明 在 调用 longjmp 后 ， 自 动 变量 、 全 局 变量 、 寄 存 器 变量 、 
静态 变量 和 易 失 变量 的 不 同情 况 。 


程序 清单 7-6 ”longjmp 对 各 类 变量 的 影响 


#include "apue.h" 
#include <setjmp.h> 


Static void fl(int, int, int, int); 
Btatic void f2(void); 
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static jmp_buf jmpbuffer; 
static int globval; 
int 

main (void) 


{ 


int autoval; 
register int regival; 
volatile int volaval; 
static int Btatval; 


globval = 1; autoval = 2; regival = 3; volaval = 4; statval = 5; 


if (setjmp(jmpbuffer) != 0) { 
printf ("after longjmp:\n"); 
printf ("globval = %d, autoval = %d, regival = %d," 
" volaval = %d, statval = %d\n", 
globval, autoval, regival, volaval, statval) ; 


exit (0); 
} 
/* 
* Change variables after setjmp, but before longjmp. 
vf 
globval = 95; autoval = 96; regival = 97; volaval = 98; 
statval = 99; 


fl(autoval, regival, volaval, statval); /* never returns */ 
exit (0); 


} 


static void 
fl(int i, int j, int k, int 1) 
{ 
printf ("in f1():Wn"); 
printf ("globval = %d, autoval = td, regival = %d," 
" volaval = %d, statval = %d\n", globval, i, j, k, 1); 
£2(); 


} 


static void 
£2 (void) 


{ 
longjmp(jmpbuffer, 1); 





如 果 以 不 带 优化 和 带 优化 选项 对 此 程序 分 别 进 行 编译 ， 然 后 运行 它们 ， 则 得 到 的 结果 是 不 


同 的 ; 


$ cc testjmp.c 不 进行 任何 优化 的 编译 

$ ./a.out 

in f1(): 

globval = 95, autoval = 96, regival = 97, volaval = 98, statval 
after longjmp: 

globval = 95, autoval = 96, regival = 97, volaval = 98, statval 
$ cc -0 testjmp.c 进行 全 部 优化 的 编译 

$ ./a.out 

in f1(): 

globval = 95, autoval = 96, regival = 97, volaval = 98, statval = 99 
after longjmp: 

globval = 95, autoval = 2, regival = 3, volaval = 98, statval = 99 


99 


99 


注意 ， 全 局 、 静 态 和 易 失 变量 不 受 优化 的 影响 ， 在 调用 1ongjmp 之 后 ， 它 们 的 值 是 最 近 所 呈现 
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的 值 。 某 个 系统 的 setjmp(3) 手 册页 上 说 明 ， 存 放 在 存储 器 中 的 变量 将 具有 1ongjmp 时 的 值 ， 
而 在 CPU 和 浮 点 寄存 器 中 的 变量 则 恢复 为 调用 setjmp 时 的 值 。 这 确实 就 是 运行 程序 清单 7-6 中 的 
程序 时 所 观察 到 的 值 。 不 进行 优化 时 ， 所 有 这 5 个 变量 都 存放 在 存储 器 中 〈 亦 即 忽略 了 对 
regival 变 量 的 register 存 储 类 说 明 )。 而 进行 了 优化 后 ，autoval 和 regival 都 存放 在 寄 
存 器 中 (即使 autoVal 并 未 声明 为 register)，volatile 变 量 则 仍 存放 在 存储 器 中 。 通 过 
这 一 实例 我 们 可 以 理解 到 ， 如 果 要 编写 一 个 使 用 非 局 部 跳 转 的 可 移植 程序 ， 则 必须 使 用 
volatile 属 性 。 但 是 从 一 个 系统 移植 到 另 一 个 系统 ， 任 何事 情 都 可 能 改变 。 
在 程序 清单 7-6 中 ， 某 些 printf 的 格式 字符 串 可 能 不 适宜 安排 在 程序 文本 的 一 行 中 。 我 们 
没有 将 其 分 成 多 个 printf 调 用 ， 而 是 使 用 了 ISO C 的 字符 串 连 接 功 能 ， 王 是 两 个 字符 串 序 列 
"stringl" "string2" 
等 价 干 


"stringlstring2" 口 


第 10 章 讨论 信号 处 理 程序 及 其 信号 版 本 sigsetjmp 和 siglongjmp 时 ， 将 再 次 涉及 
setjmp 和 longjmp 函 数 。 

2. 自动 变量 的 潜在 问题 

前 面 已 经 说 明了 处 理 栈 帧 的 一 般 方式 ， 现 在 值得 分 析 一 下 自动 变量 的 一 个 潜在 出 错 情况 。 
基本 规则 是 声明 自动 变量 的 函数 已 经 返回 后 ， 不 能 再 引用 这 些 自动 变量 。 在 整个 UNIX 系 统 手 
册 中 ， 关 于 这 一 点 有 很 多 警告 。 

程序 清单 7-7 中 示 出 了 一 个 名 为 open_data 的 函数 ， 它 打开 了 一 个 标准 VO 流 ， 然 后 为 该 流 
设置 缓存 。 


程序 清单 7-7 自动 变量 的 不 正确 使 用 


#include «Btdio.h» 
#define DATAFILE "datafile" 
FILE * 


open data (void) 


FILE *fp; i 
char databuf [BUFSIZ]; /* setvbuf makes this the stdio buffer */ 
if ((fp = fopen(DATAFILE, "r")) == NULL) 
return (NULL) ; 
if (setvbuf(fp, databuf,  IOLBF, BUFSIZ) != 0) 
return (NULL) ; 
return (fp) ; /* error */ 


} 


问题 是 ， 当 open_data 返 回 时 ， 它 在 栈 上 所 使 用 的 空间 将 由 下 一 个 被 调用 函数 的 栈 帧 使 
用 。 但 是 ,标准 VO 库 函 数 仍 将 使 用 其 流 缓冲 区 的 存储 空间 。 这 就 产生 了 冲突 和 混乱 。 为 了 校正 
这 一 问题 ， 应 在 全 局 存储 空间 静态 地 (如 static 或 extern) 或 者 动态 地 (使 用 一 种 a1lloc 函 
数 ) 为 数组 aatabuf 分 配 空间 。 


7.11 getrlimit#setrlimitmeA 
每 个 进程 都 有 一 组 资源 限制 ， 其 中 一 些 可 以 用 getr1l1imit 和 setrlimit 函 数 查 询 和 更 改 。 
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#include <sys/resource.h> 


int getrlimit (int resource, struct rlimit *rlptr) ; 


int setrlimit (int resource, const struct rlimit *rlptr); 


FAAP RCRA: 车 成 功 则 返回 0， 若 出 错 则 返回 非 0 值 


这 两 个 函数 在 Single UNIX Specification 中 定义 为 XSI 扩 展 。 进 程 的 资源 限制 通常 是 在 系统 
初始 化 时 由 进程 0 建立 的 ， 然 后 由 每 个 后 续 进程 继承 。 每 种 实现 都 可 以 用 自己 的 方法 对 各 种 限 
制 做 出 调整 。 

对 这 两 个 函数 的 每 一 次 调用 都 会 指定 一 个 资源 以 及 一 个 指向 下 列 结构 的 指针 。 

struct rlimit { 

rlim t rlim cur; /* soft limit: current limit */ 

rlim t rlim max; /* hard limit: maximum value for rlim cur */ 

在 更 改 资源 限制 时 ， 须 遵循 下 列 三 条 规则 ， 

(1) 任何 一 个 进程 都 可 将 一 个 软 限制 值 更 改 为 小 干 或 等 干 其 硬 限制 值 。 

(2) 任何 一 个 进程 都 可 降低 其 硬 限制 值 ， 但 它 必 须 大 于 或 等 于 其 软 限制 值 。 这 种 降低 对 普 
通用 户 而 言 是 不 可 逆 的 。 

(3) 只 有 超级 用 户 进程 可 以 提高 硬 限 制 值 。 
常量 RLIM_INFINITY 指 定 了 一 个 无 限量 的 限制 。 

这 两 个 函数 的 resource 参 数 取 下 列 值 之 一 。 表 7-3 显 示 哪 些 资源 限制 是 由 Single UNIX 
Specification 定 义 并 受到 本 书 讨论 的 4 种 UNIX 系 统 实现 支持 的 。 


表 7-3 ”对 资源 限制 的 支持 


| mø (xst | FreeBSD521 — Limx2422 — M&cOSX103  Solaris9 | FreeBSD 5.2.1 Linux 2.4.22 Mac OS X 10.3 Solaris 9 


RLIMIT_CORE 

RLIMIT_CPU 

RLIMIT_DATA 

RLIMIT_FSIZE 

RLIMIT LOCKS 

RLIMIT AS 进程 可 用 存储 区 的 最 大 总 长 度 ( 字 节 )。 这 会 影响 sbrk 函 数 (1.1145) 
和 mmap 尔 数 (14.955), 

RLIMIT CORE core 文 件 的 最 大 字 节 数 ， 若 其 值 为 0 则 阻止 创建 core 文 件 。 

RLIMIT_CPU CPU 时 间 的 最 大 量 值 (Pb), ， 当 超过 此 软 限 制 时 ， 向 该 进程 发 送 
SIGXCPU 信 号 。 


RLIMIT_MEMLOCK 
RLIMIT_DATA 数据 段 的 最 大 字 节 长 度 。 这 是 图 7-3 中 初始 化 数据 、 非 初始 以 及 堆 的 

































RLIMIT_NOFILE 
RLIMIT_NPROC 
RLIMIT_RSS 
RLIMIT_SBSIZE 
RLIMIT_STACK 
RLIMIT_VMEM 
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总 和 。 
RLIMIT_FSIZE 可 以 创建 的 文件 的 最 大 字 节 长 度 。 当 超过 此 软 限 制 时 ， 则 向 该 进程 
发 送 SIGXFSzZ 信 号 。 
RLIMIT_LOCKS 一 个 进程 可 持 有 的 文件 锁 的 最 大 数 (此 数 也 包括 Linux 特 有 的 文件 租 
借 数 。 详 见 Linux fcnt1(2) 手 册页 ) 。 
RLIMIT MEMLOCK ”一 个 进程 使 用 m1ock(2) 能 够 锁定 在 存储 器 中 的 最 大 字 节 长 度 。 
RLIMIT NOFILE 每 个 进程 能 打开 的 最 大 文件 数 。 更 改 此 限制 将 影响 到 sysconf 函 数 
在 参数 _SC_OPEN_MAX 中 返回 的 值 ( 见 2.5.4 节 )。 亦 见 程序 清单 2-4。 
RLIMIT_NPROC 每 个 实际 用 户 ID 可 拥有 的 最 大 子 进程 数 。 更 改 此 限制 将 影响 到 
sysconf 尔 数 在 参数 _SC_CHILD_MAX 中 返回 的 值 ( 见 2.5.4 节 ) 。 
RLIMIT_RSS 最 大 驻 内 存 集 的 字 节 长 度 (resident set size in bytes，RSS)。 如 果 物 
理 存储 器 供不应求 ， 则 内 核 将 从 进程 处 取 回 超过 RSS 的 部 分 。 
RLIMIT_SBSIZE 用户 在 任 一 给 定时 刻 可 以 占用 的 套 接 字 缓 神 区 的 最 大 长 度 ( 字 节 )。 
RLIMIT_STACK 栈 的 最 大 字 节 长 度 。 见 图 7-3。 
RLIMIT_VMEM 这 是 RLIMIT_AS 的 同义词 。 
资源 限制 影响 到 调用 进程 并 由 其 子 进程 继承 。 这 就 意味 着 为 了 影响 一 个 用 户 的 所 有 后 续 进 
程 ， 需 将 资源 限制 的 设置 构造 在 shell 之 中 。 确 实 ，Bourne shell, GNU Bourne-again shell 和 Korn 
shell 具 有 内 置 的 ul imit 命 令 ，C shell 具 有 内 置 的 1imit 命 令 。(umask 和 chair 函 数 也 必须 是 
shell 内 置 的 。) 









程序 清单 7-8 中 的 程序 打印 由 系统 支持 的 所 有 资源 当前 的 软 限制 和 硬 限制 。 为 了 在 各 种 实现 
上 编译 该 程序 ， 我 们 已 经 有 条 件 地 包括 了 各 种 不 同 的 资源 名 。 另 请 注意 ， 有 些 平台 定义 *lim t 
为 unsigned long longtfidEunsigned long， 对 干 此 种 平台 ， 必须 使 用 不 同 的 printf 格 式 。 


程序 清单 7-8 打印 当前 资源 限制 


#include "apue .hn 

#if defined(BSD) || defined (MACOS) 
#include <sys/time.h> 

#define FMT "%10lld " 

#else 

#define FMT "$101d 

#endif 

#include <sys/resource.h> 


#define doit(name) pr _limits(#name, name) 
static void pr limits(char *, int); 

int 

main(void) 


#ifdef  RLIMIT AS 
doit (RLIMIT_AS) ; 
#endif 
doit(RLIMIT CORE); 
doit (RLIMIT CPU); 
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doit(RLIMIT DATA); 
doit(RLIMIT FSIZE); 
#ifdef  RLIMIT LOCKS 
doit (RLIMIT LOCKS); 
#endif 
#ifdef RLIMIT_MEMLOCK 
doit (RLIMIT_MEMLOCK) ; 
#endif 
doit (RLIMIT_NOFILE) ; 
#ifdef  RLIMIT NPROC 
doit(RLIMIT NPROC); 
#endif 
#ifdef RLIMIT_RSS 
doit (RLIMIT_RSS) ; 
#endif 
#ifdef RLIMIT_SBSIZE 
doit (RLIMIT_SBSIZE) ; 
#tendif 
doit (RLIMIT_STACK) ; 
#ifdef RLIMIT_VMEM 
doit (RLIMIT_VMEM) ; 
#endif 
exit (0); 
} 


Static void 
pr_limits(char *name, int resource) 


{ 


struct rlimit limit; 


if (getrlimit (resource, &limit) < 0) 
err_sys("getrlimit error for $5", name); 

printf ("%-14s ", name); 

if (limit.rlim cur == RLIM_INFINITY) 
printf("(infinite)  "); 

else 
printf(FMT, limit.rlim cur); 

if (limit.rlim max == RLIM_INFINITY) 
printf (" (infinite) "); 

else 
printf (FMT, limit.rlim max); 

putchar ((int)’\n’); 





注意 ， 在 doit 宏 中 使 用 了 ISO C 的 字符 串 创建 运算 符 (#) ， 以 便 为 每 个 资源 名 产生 字符 捉 
值 。 例 如 : 


doit (RLIMIT_CORE) ; 


XS CHET RA: 


pr limits("RLIMIT CORE", RLIMIT CORE); 


在 FreeBSD 下 运行 此 程序 ， 得 到 : 


$ ./a.out 

RLIMIT_CORE (infinite) (infinite) 
RLIMIT_CPU (infinite) (infinite) 
RLIMIT DATA 536870912 536870912 
RLIMIT FSIZE (infinite) (infinite) 


RLIMIT MEMLOCK  linfinite) (infinite) 
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RLIMIT NOFILE 1735 1735 
RLIMIT NPROC 867 867 
RLIMIT RSS (infinite) (infinite) 
RLIMIT SBSIZE (infinite) (infinite) 
RLIMIT STACK 67108864 67108864 
RLIMIT VMEM (infinite) (infinite) 
在 Solaris 下 运行 此 程序 ， 得 到 ; 

$ ./a.out 

RLIMIT_AS (infinite) (infinite) 
RLIMIT_CORE (infinite) (infinite) 
RLIMIT_CPU (infinite) (infinite) 
RLIMIT_DATA (infinite) (infinite) 
RLIMIT_FSIZE (infinite) (infinite) 
RLIMIT_NOFILE 256 65536 
RLIMIT STACK 8388608 (infinite) 
RLIMIT VMEM (infinite) (infinite) g 





在 介绍 了 信和 号 机 构 后 ， 习 题 10.11 将 继续 讨论 资源 限制 。 
2 小 结 
理解 UNIX 环 境 中 C 程 序 的 环境 是 理解 UNIX 进 程控 制 特征 的 先决 条 件 。 本 章 说 明了 一 个 进 


程 是 如 何 局 动 和 终止 的 ， 如 何 向 其 传递 参数 表 和 环境 。 虽 然 这 两 者 都 不 是 由 内 核 进行 解释 的 ， 
但 内 核 起 到 了 从 exec 的 调用 者 将 这 两 者 传递 给 新 进程 的 作用 。 


本 章 也 说 明了 C 程 序 的 典型 存储 空间 布局 ， 以 及 一 个 进程 如 何 动态 地 分 配 和 释放 存储 器 。 


详细 地 了 解 用 于 维护 环境 的 一 些 函 数 是 值得 的 ， 因 为 它们 涉及 存储 器 分 配 。 本 章 也 介绍 
setjmp 和 1]ongjmp 函 数 ， 它 们 提供 了 一 种 在 进程 内 执行 非 局 部 转移 的 方法 。 最 后 介绍 了 各 种 
实现 提供 的 资源 限制 功能 。 


Jä 


7. 


m 


7.2 
7.3 


7.4 


7.5 


7.6 


7.7 
7.8 


7.9 


在 Intel x86 系 统 上 ， 无 论 使 用 FreeBSD 或 Linux ， 如 果 执 行 一 个 输出 “hello, world" {BA 
调用 exit 或 return 的 程序 ， 则 程序 的 返回 代码 为 13 (用 shell 检 查 )， 解 释 其 原因 。 

程序 清单 7-2 中 的 printf 函 数 的 结果 何 时 才 会 被 真正 输出 ? 

是 否 有 方法 不 使 用 (a) 参数 传递 (b) 全 局 变量 这 两 种 方法 ， 将 main 中 的 参数 argc 和 
argv 传 递 给 它 所 调用 的 其 他 函数 ? 

在 有 些 UNIX 系 统 中 执行 程序 时 访问 不 到 其 数据 段 的 单元 96， 这 是 一 种 有 意 的 安排 ， 为 什 
么 ? 

用 C 语 言 的 typdef 工 具 为 终止 处 理 程序 定义 一 个 新 数据 类 型 Exitfunc， 使 用 该 类 型 修 
改 atexit 的 原型 。 

如 果 用 calloc 分 配 一 个 Long 型 的 数组 ， 数 组 的 初始 值 是 否 为 0? 如 果 用 cal1loc 分 配 一 
个 指针 数组 ， 数 组 的 初始 值 是 否 为 空 指针 ? 

在 7.6 节 size 命 令 的 输出 结果 中 ， 为 什么 没有 给 出 堆 和 栈 的 大 小 ? 

为 什么 7.7 节 中 两 个 文件 的 大 小 (4755703011410). 不 等 于 它们 各 自 的 文本 和 数据 大 小 之 
和 ? 

为 什么 7.7 节 中 对 程序 使 用 共享 库 以 后 改变 了 其 可 执行 文件 的 大 小 ? 
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740 在 7.10 节 末尾 ， 我 们 已 经 说 明 为 什么 不 能 将 一 个 指针 返回 给 一 个 自动 变量 ， 下 面 的 程序 是 
否 正确 ? 
int 
fl(int val) 


{ 


int *ptr; 


if (val == 0) { 


int val; 
val = 5; 
ptr = &val; 


} 


return(*ptr + 1); 
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第 8 章 
进程 控制 


8.1 引言 


本 章 介 绍 UNIX 的 进程 控制 ， 包 括 创建 新 进程 、 执 行程 序 和 进程 终止 。 还 将 说 明 进 程 属 性 
的 各 种 ID 一 一 实际 、 有 效 和 保存 的 用 户 和 组 ID ， 以 及 它们 如 何 受到 进程 控制 原 语 的 影响 。 本 章 
还 包括 了 解释 器 文件 和 system 函 数 。 本 章 最 后 讲述 大 多 数 UNIX 系 统 所 提供 的 进程 会 计 机 制 。 
这 种 机 制 使 我 们 能 够 从 另 一 个 角度 了 解 进程 的 控制 功能 。 
8.2 进程 标识 符 

每 个 进程 都 有 一 个 非 负 整 型 表示 的 唯一 进程 ID。 因 为 进程 ip 标识 符 总 是 唯一 的 ， 常 将 其 用 
作 其 他 标识 符 的 一 部 分 以 保证 其 唯一 性 。 例 如 ， 应 用 程序 有 时 就 把 进程 ID 作 为 名 字 的 一 部 分 来 
创建 一 个 唯一 的 文件 名 。 

虽然 是 唯一 的 ， 但 是 进程 ID 可 以 重用 。 当 一 个 进程 终止 后 ， 其 进程 ID 就 可 以 再 次 使 用 了 。 
大 多 数 UNIX 系 统 实现 延迟 重用 算法 ， 使 得 赋予 新 建 进程 的 ID 不 同 于 最 近 终 止 进程 所 使 用 的 ID。 
这 防止 了 将 新 进程 误 认为 是 使 用 同一 ID 的 某 个 已 终止 的 先前 进程 。 

系统 中 有 一 些 专用 的 进程 ， 但 具体 细节 因 实 现 而 异 。ID 为 0 的 进程 通常 是 调度 进程 ， 常 常 被 
称 为 交换 进程 (swapper)。 该 进程 是 内 核 的 一 部 分 ， 它 并 不 执行 任何 磁盘 上 的 程序 ， 因 此 也 被 
称 为 系统 进程 。 进 程 ID 1 通常 是 init 进 程 ， 在 自 举 过 程 结 束 时 由 内 核 调用 。 该 进程 的 程序 文件 
在 UNIX 的 早期 版 本 中 是 /etc/init， 在 较 新 版 本 中 是 /sbin/init。 此 进程 负责 在 自 举 内 核 
后 启动 一 个 UNIX 系 统 。init 通 常 读 与 系统 有 关 的 初始 化 文件 (/etc/rc* 文 件 或 /etc/ 
inittab 文 件 ， 以 及 /etc/init.d 中 的 文件 )， 并 将 系统 引导 到 一 个 状态 (例如 多 用 户 )。 
init 进 程 决 不 会 终止 。 它 是 一 个 普通 的 用 户 进 程 (与 交换 进程 不 同 , 它 不 是 内 核 中 的 系统 进程 )， 
但 是 它 以 超级 用 户 特权 运行 。 本 章 稍 后 部 分 会 说 明 init 如 何 成 为 所 有 孤儿 进程 的 父 进程 。 

每 个 UNIX 系 统 实现 都 有 它 自己 的 一 套 提供 操作 系统 服务 的 内 核 进程 ， 例 如 ， 在 某 些 UNIX 
的 虚拟 存储 器 实现 中 ， 进 程 ID 2 是 页 守护 进程 (pagedaemon)。 此 进程 负责 支持 虚拟 存储 系统 
的 分 页 操作 。 

除了 进程 ID， 每 个 进程 还 有 一 些 其 他 的 标识 符 。 下 列 函数 返回 这 些 标识 符 。 

#include <unistd.h> 

pid t getpid (void); 

返回 值 : 调用 进程 的 进程 ID 


pid t getppid(void); 





返回 值 : 调用 进程 的 父 进 程 ID 
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( 续 ) 













uid t getuid(void) ; 
返回 值 : 调用 进程 的 实际 用 户 ID 
uid t geteuid(void) ; 
返回 值 : 调用 进程 的 有 效用 户 ID 
gid_t getgid(void); 
返回 值 : 调用 进程 的 实际 组 ID 
gid t getegid(void); 
返回 值 : 调用 进程 的 有 效 组 ID 
注意 ， 这 些 函 数 都 没有 出 错 返 回 ， 在 下 一 节 中 讨论 Eork 函 数 时 ， 将 进一步 讨论 父 进程 ID。 
在 4.4 节 中 已 讨论 了 实际 和 有 效用 户 及 组 ID。 
8.3 fork% 


一 个 现 有 进程 可 以 调用 fork 函 数 创 建 一 个 新 进程 。 


#include <unistd.h> 








pid_t fork(void) ; 





返回 值 : 子 进程 中 返回 0， 父 进程 中 返回 子 进程 ID 出 错 返 回 -1 


由 fork 创 建 的 新 进程 被 称 为 子 进程 (child process)。fork 函 数 被 调用 一 次 ， 但 返回 两 次 。 
两 次 返回 的 唯一 区 别 是 子 进程 的 返回 值 是 9， 而 父 进程 的 返回 值 则 是 新 子 进程 的 进程 ID。 将 子 
进程 ID 返回 给 父 进程 的 理由 是 : 因为 一 个 进程 的 子 进程 可 以 有 多 个 ， 并 且 没 有 -- 个 函数 使 一 个 
进程 可 以 获得 其 所 有 子 进程 的 进程 ID。fork 使 子 进程 得 到 返回 值 0 的 理由 是 : 一 个 进程 只 会 
一 个 父 进程 ， 所 以 子 进程 总 是 可 以 调用 getppia 以 获得 其 父 进程 的 进程 ID (进程 ID 0 总 是 由 内 
核 交 换 进程 使 用 ， 所 以 一 个 子 进程 的 进程 ID 不 可 能 为 0)。 

子 进程 和 父 进程 继续 执行 Eork 调 用 之 后 的 指令 。 子 进程 是 父 进程 的 副本 。 例 如 ， 子 进程 
获得 父 进程 数据 空间 、 堆 和 栈 的 副本 。 注 意 ， 这 是 子 进程 所 拥有 的 副本 。 父 、 子 进程 并 不 共享 
这 些 存储 空间 部 分 。 父 、 子 进程 共享 正文 段 (417.645). 

由 于 在 fork 之 后 经 常 跟随 着 exec， 所 以 现在 的 很 多 实现 并 不 执行 一 个 父 进程 数据 段 、 栈 
和 堆 的 完全 复制 。 作 为 厅 代 ， 使 用 了 写 时 复制 (Copy-On-Write, COW) 技术 。 这 些 区 域 由 父 、 
子 进 程 共享 ， 而 且 内 核 将 它们 的 访问 权限 改变 为 只 读 的 。 如 果 父 、 子 进程 中 的 任 一 个 试图 修改 
这 些 区 域 , 则 内 核 只 为 修改 区 域 的 那 块 内 存 制作 一 个 副本 , 通常 是 虚拟 存储 器 系统 中 的 一 “页 ”。 
Bach[1986] 的 9.2 节 和 McKusick 等 [1996] 的 5.6 节 和 5.7 节 对 这 种 特征 做 了 更 详细 的 说 明 。 


某 些 平台 提供 fork 函 数 的 几 种 变 体 。 本 书 讨论 的 四 各 平台 都 支持 下 一 节 说 明 的 vfork(2) 朗 体 。 

Linux 2.4.22 提 供 了 另 一 种 新 进程 创建 函数 一 clone(2) 系 统 调 用 。 这 是 一 种 fork 的 泛 型 ， 它 允许 
调用 者 控制 哪些 部 分 由 父 、 子 进程 共享 。 

FreeBSD 5.2.1 提 供 了 Tfork(2) 系 统 调用 ， 它 类 似 于 Linux 的 clone 系 统 调 用 。rfork 调 用 是 从 Plan 
9 操作 系统 (Pike 等 [1995]) 派生 出 来 的 。 
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Solaris 9 提供 了 两 个 线程 序 : 一 个 用 于 POSIX 线 程 (pthread) ， 另 一 个 用 于 Solaris 线 程 。 在 这 两 个 
线程 序 中 ，fork 的 特征 有 所 不 同 。 对 于 POSIX 线 程 ，Eork 创 建 一 个 进程 ， 它 仅 包 含 调 用 该 fork 的 线程 ， 
但 是 ， 对 于 Solaris 线 程 ，fork 创 建 的 进程 包含 了 调用 线程 所 在 进程 的 所 有 线程 的 副本 。 为 了 提供 与 
POSIX 线 程 类 似 的 语义 ，Solaris 提 供 了 fork(1) 函 数 ， 它 创建 的 进程 只 复制 调用 线程 ， 而 与 所 使 用 的 线 
程 库 无 关 。 第 11 和 12 章 将 详细 讨论 线程 。 


实 i 


程序 清单 8-1 中 的 程序 演示 了 fork 函 数 ， 从 中 可 以 看 到 子 进程 对 变量 所 作 的 改变 并 不 影响 
父 进 程 中 该 变量 的 值 。 


程序 清单 8-1 fork 函数 示例 





#include "apue.h" 


int glob = 6; /* external variable in initialized data */ 
char buf [] = "a write to stdout\n"; 
int 
main (void) 
{ 
int var; /* automatic variable on the stack */ 
pidit pid; 
var = 88; 
if (write (STDOUT_FILENO, buf, sizeof(buf)-1) != sizeof (buf) -1) 
err Sys("write error"); 
printf("before fork\n") ; /* we don’t flush stdout */ 


if ((pid = fork()) < 0) { 
err_sys("fork error"); 
} else if (pid == 0) { /* child */ 
glob++; /* modify variables */ 
Var+t+; 
} else { 
sleep (2); /* parent */ 
} 


printf ("pid = $d, glob = %d, var = %d\n", getpid(), glob, var); 
exit (0); 





如 采 执 行 此 程序 则 得 到 : 


$ ./a.out 
a write to stdout 

before fork 

pid = 430, glob = 7, var = 89 子 进 程 的 变量 值 改变 了 
pid = 429, glob = 6, var = 88 父 进 程 的 变量 值 没有 改变 
$ ./a.out > temp.out 

$ cat temp.out 

a write to stdout 

before fork 

pid = 432, glob = 7, var = 89 

before fork 
pid = 431, glob 


6, var = 88 


一 般 来 说 ， 在 fork 之 后 是 父 进程 先 执行 还 是 子 进程 先 执行 是 不 确定 的 。 这 取决 于 内 核 所 使 用 
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的 调度 算法 。 如 果 要 求 父 、 子 进程 之 间 相 互 同 步 ， 则 要 求 某 种 形式 的 进程 间 通 信 。 在 程序 清单 
8-1 中 ， 父 进程 使 自己 休眠 2 秒 钟 ， 以 使 子 进程 先 执行 。 但 并 不 保证 2 秒 钟 已 经 足够 ， 在 8.9 节 说 
明 竞 争 条 件 时 ， 还 将 谈 及 这 一 问题 及 其 他 类 型 的 同步 方法 。 在 10.16 节 中 ， 我 们 将 说 明 在 fork 
之 后 如 何 使 用 信号 使 父 、 子 进程 同步 。 

当 写 到 标准 输出 时 ， 我 们 将 buf 长 度 减 去 1 作为 输出 字 节 数 ， 这 是 为 了 避免 将 终止 aull 字 节 
写 出 。str1len 计 算 不 包含 终止 null 字 节 的 字符 串 长 度 ， 而 sizeof 则 计算 包括 终止 null 字 节 的 
缓冲 区 长 度 。 两 者 之 间 的 另 一 个 差别 是 ， 使 用 strlen 需 进行 一 次 函数 调用 ， 而 对 于 si zeof 而 
言 ， 因 为 缓冲 区 已 用 已 知 字 符 捉 进行 了 初始 化 ， 其 长 度 是 固定 的 ， 所 以 sizeof 在 编译 时 计算 
缓冲 区 长 度 。 

注意 程序 清单 8-1 中 fork 与 VO 函数 之 间 的 交互 关系 。 回 忆 第 3 章 中 所 述 ，write 函 数 是 不 带 
缓冲 的 。 因 为 在 fork 之 前 调用 write， 所 以 其 数据 写 到 标准 输出 一 次 。 但 是 ， 标 准 1/O 库 是 带 
缓冲 的 。 回 忆 一 下 5.12 节 ， 如 果 标 准 输出 连 到 终端 设备 ， 则 它 是 行 缓 冲 的 ， 否 则 它 是 全 缓冲 的 。 
当 以 交互 方式 运行 该 程序 时 ， 只 得 到 该 printf 输 出 的 行 一 次 ， 其 原因 是 标准 输出 缓冲 区 由 换 
行 符 冲 洗 。 但 是 当 将 标准 输出 重 定 向 到 一 个 文件 时 ， 却 得 到 printf 输 出 行 两 次 。 其 原因 是 ， 
在 fork 之 前 调用 了 printf 一 次 ,但 当 调 用 fork 时 ， 该 行 数据 仍 在 缓冲 区 中 ， 然 后 在 将 父 进 
程 数据 空间 复制 到 子 进程 中 时 ， 该 缓冲 区 也 被 复制 到 子 进程 中 。 于 是 那 时 父 、 子 进程 各 自 有 了 
带 该 行内 容 的 标准 IO 缓冲 区 。 在 exit 之 前 的 第 二 个 printf 将 其 数据 添加 到 现 有 的 缓冲 区 中 。 
当 每 个 进程 终止 时 ， 最 终 会 冲洗 其 缓冲 区 中 的 副本 。 口 


文件 共享 

对 程序 清单 8-1 需 注意 的 另 一 点 是 ， 在 重 定向 父 进程 的 标准 输出 时 ， 子 进程 的 标准 输出 也 被 
重 定向 。 实 际 上 ，fork 的 一 个 特性 是 父 进程 的 所 有 打开 文件 描述 符 都 被 复制 到 子 进程 中 。 父 、 
子 进程 的 每 个 相同 的 打开 描述 符 共 享 一 个 文件 表 项 ( 见 图 3-3)。 

考虑 下 述 情况 ， 一 个 进程 具有 三 个 不 同 的 打开 文件 ， 它 们 是 标准 输入 、 标 准 输出 和 标准 出 
错 。 在 从 fork 返 回 时 ， 我 们 有 了 如 图 8-1 中 所 示 的 结构 。 

这 种 共享 文件 的 方式 使 父 、 子 进程 对 同一 文件 使 用 了 一 个 文件 偏 移 量 。 考 虑 下 述 情况 ; 一 
个 进程 fork 了 一 个 子 进程 ， 然 后 等 待 子 进程 终止 。 假 定 ， 作 为 普通 处 理 的 一 部 分 ， 父 、 子 进 
程 都 向 标准 输出 进行 写 操作 。 如 果 父 进程 的 标准 输出 已 重 定向 (很 可 能 是 由 shell 实 现 的 )， 那 
么 子 进程 写 到 该 标准 输出 时 ， 它 将 更 新 与 父 进 程 共 享 的 该 文件 的 偏 移 量 。 在 我 们 所 考虑 的 例子 
中 ， 当 父 进程 等 待 子 进程 时 ， 子 进程 写 到 标准 输出 ， 而 在 子 进程 终止 后 ， 父 进程 也 写 到 标准 输 
出 上 ， 并 且 知道 其 输出 会 添加 在 子 进程 所 写 数据 之 后 。 如 果 父 、 子 进程 不 共享 同一 文件 偏 移 量 ， 
这 种 形式 的 交互 就 很 难 实现 。 

如 果 父 、 子 进程 写 到 同一 描述 符 文 件 ， 但 又 没有 任何 形式 的 同步 (例如 使 父 进程 等 待 子 进 
程 )， 那 么 它们 的 输出 就 会 相互 混合 (假定 所 用 的 描述 符 是 在 fork 之 前 打开 的 )。 虽 然 这 种 情 
况 是 可 能 发 生 的 ( 见 图 8-1)， 但 这 并 不 是 常用 的 操作 模式 。 

在 fork 之 后 处 理 文件 描述 符 有 两 种 常见 的 情况 

(1) 父 进程 等 待 子 进程 完成 。 在 这 种 情况 下 ， 父 进程 无 需 对 其 描述 符 做 任何 处 理 。 当 子 进 
程 终止 后 ， 它 曾 进行 过 读 、 写 操作 的 任 一 共享 描述 符 的 文件 偏 移 量 已 执行 了 相应 更 新 。 

(2) 父 、 子 进程 各 自 执行 不 同 的 程序 段 。 在 这 种 情况 下 ， 在 fork 之 后 ， 父 、 子 进程 各 自 关 
闭 它 们 不 需 使 用 的 文件 描述 符 ， SES TAA SETAE 这 种 方法 是 网 络 服务 
进程 中 经 常 使 用 的 。 
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父 进程 表 项 文件 表 v 节 点 表 


文件 状态 标志 
| | 当前 文件 偏 移 量 
v 节 点 指针 


文件 状态 标志 
当前 文件 偏 移 量 
v 节 点 指针 


文件 状态 标志 
fa 标志 文件 指针 当前 文件 偏 移 量 





当前 文件 长 度 








图 8-1 调用 fork 之 后 父子 进程 之 间 对 打开 文件 的 共享 


除了 打开 文件 之 外 ， 父 进程 的 很 多 其 他 属性 也 由 子 进程 继承 ， 包 括 

*， 实 际 用户 ID、 实 际 组 也、 有 效用 户 ID、 有 效 组 ID。 

“附加 组 ID。 

。 进 程 组 ID。 

* RHID, 

。 控 制 终端 。 

“设置 用 户 ID 标志 和 设置 组 ID 标志 。 

。 当 前 工作 目录 。 

。 根 目录 。 

。 文 件 模式 创建 屏蔽 字 。 

*。 信 号 屏蔽 和 安排 。 

*。 针 对 任 一 打开 文件 描述 符 的 在 执行 时 关闭 (close-on-exec) 标志 。 

*。 环境。 

。 连 接 的 共享 存储 段 。 

-FRI 

。 资 源 限制 。 

父 、 子 进程 之 间 的 区 别 是 ; 

。fork 的 返回 值 。 

*。 进 程 ID 不 同 。 

。 两 个 进程 具有 不 同 的 父 进 程 ID， 子 进程 的 父 进程 ID 是 创建 它 的 进程 的 ID， 而 父 进程 的 父 
进程 ID 则 不 变 。 

。 子 进程 的 tms_utime、tms_stime、tms_cutime 以 及 tms_ustime 均 被 设置 为 0。 
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。 父 进程 设置 的 文件 锁 不 会 被 子 进程 继承 。 

。 子 进程 的 未 处 理 的 曾 钟 (alarm) 被 清除 。 

。 子 进程 的 未 处 理 信 号 集 设置 为 空 集 。 

其 中 很 多 特性 至 今 尚未 讨论 过 ， 我 们 将 在 以 后 几 章 中 对 它们 进行 说 明 。 

使 fork 失 败 的 两 个 主要 原因 是 : 系统 中 已 经 有 了 太 多 的 进程 (通常 意味 着 某 个 方面 出 了 
问题 ) ， 或 者 该 实际 用 户 ID 的 进程 总 数 超过 了 系统 限制 。 回 忆 表 2-10， 其 中 CHILD_MRAX 规 定 了 
每 个 实际 用 户 ID 在 任 一 时 刻 可 具有 的 最 大 进程 数 。 

fork 有 下 面 两 种 用 法 : 

(1) 一 个 父 进程 希望 复制 自己 ,使 父 、 子 进程 同时 执行 不 同 的 代码 段 。 这 在 网 络 服务 进程 
中 是 常见 的 一 一 父 进程 等 待 客户 端的 服务 请 求 。 当 这 种 请 求 到 达 时 ， 父 进程 调用 fork， 使 子 
进程 处 理 此 请 求 。 父 进程 则 继续 等 待 下 一 个 服务 请 求 到 达 。 

(2) 一 个 进程 要 执行 一 个 不 同 的 程序 。 这 对 shell 是 常见 的 情况 。 在 这 种 情况 下 ， 子 进程 从 
fork 返 回 后 立即 调用 exec (我 们 将 在 8.10 节 说 明 exec )。 

某 些 操作 系统 将 (2) 中 的 两 个 操作 (fork 之 后 执行 exec) 组 合成 一 个 ， 并 称 其 为 spawn。 
UNIX 将 这 两 个 操作 分 开 ， 因 为 在 很 多 场合 需要 单独 使 用 fork， 其 后 并 不 跟随 exec。 另 外 ， 
将 这 两 个 操作 分 开 ， 使 得 子 进程 在 fork 和 exec 之 间 可 以 更 改 自己 的 属性 。 例 如 LO 重 定向 、 用 
户 ID、 信 号 安排 等 。 在 第 15 章 中 有 很 多 这 方面 的 例子 。 


Single UNIX Specification 在 高 级 实 时 选项 组 中 确实 包括 了 Spawn 接 口 ， 但 是 该 接口 并 不 打算 代替 
fork 和 exec。 它 们 的 意图 是 支持 难以 有 效 实现 fork 的 系统 ， 特 别 是 对 存储 管理 缺少 硬 件 支持 的 系统 。 





8.4 vfork 函 数 
vfork 国 数 的 调用 序列 和 返回 值 与 fork 相 同 ， 但 两 者 的 语义 不 同 。 


vfork 起 源 于 较 早 的 2.9BSD。 有 些 人 认为 ， 该 函数 是 有 了 正 狼 的 。 但 是 本 书 讨论 的 四 种 平台 都 支持 
它 。 事 实 上 ，BSD 的 开发 者 在 4.4BSD 中 删除 了 该 函数 ， 但 4.4BSD 派 生 的 所 有 开放 源码 BSD 版 本 又 将 其 
收回 。 在 Single UNIX Specification 第 3 版 中 ，vfork 被 标记 为 废弃 的 接口 。 


vfork 用 于 创建 一 个 新 进程 ， 而 该 新 进程 的 目的 是 exec 一 个 新 程序 (与 上 一 节 未 尾 的 (2) 
中 一 样 )。 程 序 清 单 1-5 中 的 shell 基 本 部 分 就 是 这 类 程序 的 一 个 例子 。vfork 与 fork 一 样 都 创建 
一 个 子 进程 ， 但 是 它 并 不 将 父 进程 的 地 址 空间 完全 复制 到 子 进 程 中 ， 因 为 子 进程 会 立即 调用 
exec (或 exit)， 于 是 也 就 不 会 存 访 该 地 址 空间 。 相 反 ， 在 子 进程 调用 exec 或 exit 之 前 , 它 
在 父 进程 的 空间 中 运行 。 这 种 优化 工作 方式 在 某 些 UNIX 的 页 式 虚 拟 存储 器 实现 中 提高 了 效率 。 
《这 与 上 一 节 中 提 及 的 在 fork 之 后 跟随 exec， 并 采用 在 写 时 复制 技术 相似 ， 而 且 不 复制 比 部 
分 复制 要 更 快 一 些 。) 

Vfork 和 fork 之 间 的 另 一 个 区 别 是 : vfork 保 证 子 进程 先 运行 ， 在 它 调用 exec 或 exit 之 
后 父 进程 才 可 能 被 调度 运行 。( 如 果 在 调用 这 两 个 函数 之 前 子 进程 依赖 于 父 进程 的 进 -- 步 动作 ， 
则 会 导致 死 锁 。) 


k 例 
程序 清单 8-2 是 程序 清单 8-1 的 修改 版 ， 其 中 用 vfork 代 替 了 fork， 删 除了 对 于 标准 输出 的 
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write 调 用 。 另 外 ， 我 们 也 不 再 需要 让 父 进程 调用 sleep，vfork 已 保证 在 子 进程 调用 exec 
或 exit 之 前 ， 内 核 会 使 父 进程 处 于 休 眼 状态 。 


程序 清单 8-2 ”vfork 函 数 实 例 
#include "apue .hn 
int glob = 6; /* external variable in initialized data */ 
int 
main (void) 


int var; /* automatic variable on the stack */ 
pid t pid; 

var - 88; 

printf ("before vfork\n"); /* we don't flush stdio */ 


if ((pid = vfork()) « 0) { 
err sys("vfork error"); 


} else if (pid == 0) { /* child */ 
glob++; /* modify parent's variables */ 
var++t; 
 exit(0); /* child terminates */ 
} 
/* 
* Parent continues here. 
x 
printf("pid = %d, glob = %d, var = %d\n", getpid(), glob, var); 
exit (0); 
} 
运行 该 程序 得 到 : 
$ ./a.out 


before vfork 
pid = 29039, glob = 7, var = 89 


子 进程 对 变量 gl ob 和 var 做 增 1 操 作 ， 结 果 改 变 了 父 进程 中 的 变量 值 。 因 为 子 进 程 在 父 进 
程 的 地 址 空间 中 运行 ， 所 以 这 并 不 令 人 惊讶 。 但 是 其 作用 的 确 与 fork 不 同 。 

注意 ， 在 程序 清单 8-2 中 ,调用 了 _exit 而 不 是 exit。 正 如 7.3 节 所 述 ，_exit 并 不 执行 标 
准 WO 缓 冲 的 冲洗 操作 。 如 果 调 用 的 是 exit 而 不 是 _exit， 则 该 程序 的 输出 是 不 确定 的 。 它 依 
赖 于 标准 IO 库 的 实现 ,我 们 可 能 会 见 到 输出 没有 发 生变 化 ， 或 者 发 现 没 有 出 现 父 进程 的 
printf 输 出 。 

如 果子 进程 调用 exit， 而 该 实现 冲洗 所 有 标准 WO 流 。 如 果 这 是 函数 库 采 取 的 唯一 动作 ， 
那么 我 们 会 见 到 输出 与 子 进程 调用 _exit 所 产生 的 输出 完全 相同 ， 设 有 任何 区 别 。 如 果 该 实现 
也 关闭 标准 VO 流 ， 那 么 表示 标准 输出 FILE 对 象 的 相关 存储 区 将 被 清 0。 因 为 子 进程 借用 了 父 进 
程 的 地 址 空间 ， 所 以 当 父 进程 恢复 运行 并 调用 printf 时 ， 也 就 不 会 产生 任何 输出 ，printf 返 
回 --1。 注 意 ， 父 进程 的 STDOUT_FILENO 仍 旧 有 效 ， 子 进程 得 到 的 是 父 进程 的 文件 描述 符 数组 
的 副本 (参见 图 8-1)。 


大 多 数 exit 的 现代 实现 不 再 在 流 的 关闭 方面 自 找 麻 烦 。 因 为 进程 即将 终 正 . 那 时 内 核 将 关闭 在 进 
程 中 已 打开 的 所 有 文件 描述 符 。 在 摩 中 关闭 它们 ， 只 是 增加 了 开销 而 不 会 带 来 任何 益处 。 


图 
McKusick 等 [1996] 的 5.6 节 中 包含 了 fork 和 vfork 实 现 方 面 的 更 多 信息 。 习 题 8.1 和 8.2 则 继 


bbs.theithome.com 





~J 


N 
oo 





178 $83 进程 控制 


续 讨 论 了 vfork。 
8.5 _ exit 函数 


如 7.3 节 所 述 ， 进 程 有 下 面 5 种 正常 终止 方式 : 

(1) 在 main 函 数 内 执行 Teturn 语 句 。 如 7.3 节 中 所 述 ， 这 等 效 于 调用 exit。 

(2) 调用 exit 函 数 。 此 函数 由 ISO C 定 义 ， 其 操作 包括 调用 各 终止 处 理 程序 (终止 处 理 程 
序 在 调用 atexit 函 数 时 登记 )， 然 后 关闭 所 有 标准 VO 流 等 。 因 为 I SO C 并 不 处 理 文件 描述 符 、 
多 进程 ( 父 、 子 进程 ) 以 及 作业 控制 ， 所 以 这 一 定义 对 UNIX 系 统 而 言 是 不 完整 的 。 

(3) 调用 _exit 或 _Exit 函 数 。ISOC 定 义 _Exit， 其 目的 是 为 进程 提供 一 种 无 需 运行 终止 
处 理 程序 或 信号 处 理 程 序 而 终止 的 方法 。 对 标准 VO 流 是 否 进行 冲洗 ， 这 取决 于 实现 。 在 UNIX 
系统 中 ，_Exit 和 exit 是 同 义 的 ， 并 不 清洗 标准 1/O0 流 。_exit 函 数 由 exit 调 用 ， 它 处 理 
UNIX 特 定 的 细节 。_exit 是 由 POSIX.1 说 明 的 。 


在 大 多 数 UNIX 系 统 实现 中 ，exit(3) 是 标准 C 库 中 的 一 个 函数 ， 而 _exit(2) 则 是 一 个 系统 调用 。 


(4) 进程 的 最 后 一 个 线程 在 其 启动 例 程 中 执行 返回 语句 。 但 是 ， 该 线程 的 返回 值 不 会 用 作 
进程 的 返回 值 。 当 最 后 一 个 线程 从 其 启动 例 程 返回 时 ， 该 进程 以 终止 状态 0 返回 。 

(5) 进程 的 最 后 一 个 线程 调用 pthread_exit 函 数 。 如 同 前 面 一 样 ， 在 这 种 情况 中 ， 进 程 终 
止 状态 总 是 0， 这 与 传送 给 pthread_exit 的 参数 无 关 。 在 11.5 节 中 ， 我 们 将 对 此 做 更 多 说 明 。 

三 种 异常 终止 方式 如 下 : 

(D 调用 abort。 它 产生 SIGABRT 信 和 号， 这 是 下 一 种 异常 终止 的 一 种 特例 。 

(2) 当 进 程 接 收 到 某 些 信 号 时 。( 第 10 章 将 较 详细 地 说 明 信 号 。) 信号 可 由 进程 自身 (例如 
调用 abort 函 数 )、 其 他 进程 或 内 核 产 生 。 例 如 ， 若 进程 越 出 其 地 址 空间 访问 存储 单元 或 者 除 
以 0， 内 核 就 会 为 该 进程 产生 相应 的 信和 号。 

(3) 最 后 一 个 线程 对 “取消 ”(cancellation) 请 求 做 出 响应 。 按 系统 默认 ,“ 取 消 ” 以 延迟 方 
ARE: 一 个 线程 要 求 取消 另 一 个 线程 ， 一 段 时 间 之 后 ， 目 标 线程 终止 。 在 11.5 节 和 11.7 节 ， 
我 们 将 详细 讨论 “取消 ”请 求 。 

不 管 进程 如 何 终 止 ， 最 后 都 会 执行 内 核 中 的 同一 段 代 码 。 这 段 代码 为 相应 进程 关闭 所 有 打 
开 描 述 符 ， 释 放 它 所 使 用 的 存储 器 等 。 

对 上 述 任意 一 种 终止 情形 、 我 们 都 希望 终止 进程 能 够 通知 其 父 进程 它 是 如 何 终止 的 。 对 于 
三 个 终止 函数 (exit、_exit 和 _Exit)， 实 现 这 一 点 的 方法 是 ， 将 其 退出 状态 (exit status) 
作为 参数 传送 给 函数 。 在 异常 终止 情况 下 ， 内 核 (不 是 进程 本 身 ) 产生 一 个 指示 其 异常 终止 原 
因 的 终止 状态 (termination status) 。 在 任意 一 种 情况 下 ， 该 终止 进程 的 父 进程 都 能 用 wait 或 
waitpid 函 数 (在 下 一 节 说 明 ) 取得 其 终止 状态 。 

注意 ， 这 里 使 用 了 “退出 状态 ”( 它 是 传 向 exit 或 _exit 的 参数 ,或 main 的 返回 值 ) 和 
“终止 状态 ”两 个 术语 ， 以 表示 有 所 区 别 。 在 最 后 调用 _exit 时 ， 内 核 将 退出 状态 转换 成 终止 
状态 (回忆 图 7-1)。 下 一 节 中 的 表 8-1 说 明 父 进程 检查 子 进程 终止 状态 的 不 同方 法 。 如 果子 进程 
正常 终止 ， 则 父 进 程 可 以 获得 子 进程 的 退出 状态 。 

在 说 明 fork 函 数 时 ， 显 而 易 见 ， 子 进程 是 在 父 进程 调用 fork 后 生成 的 。 上 面 又 说 明了 子 
进程 将 其 终止 状态 返回 给 父 进 程 。 但 是 如 果 父 进程 在 子 进程 之 前 终止 ， 则 将 如 何 呢 ? 其 回答 是 ; 
对 于 父 进程 已 经 终止 的 所 有 进程 ， 它 们 的 父 进程 都 改变 为 nit 进 程 。 我 们 称 这 些 进程 由 init 
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进程 领养 。 其 操作 过 程 大 致 如 下 : 在 一 个 进程 终止 时 ， 内 核 逐 个 检查 所 有 活动 进程 ， 以 判断 它 
是 否 是 正 要 终止 进程 的 子 进程 ， 如 果 是 ， 则 将 该 进程 的 父 进程 ID 更 改 为 1 (init 进 程 的 ID)。 
这 种 处 理 方法 保证 了 每 个 进程 都 有 一 个 父 进程 。 

另 一 个 我 们 关心 的 情况 是 如 果子 进程 在 父 进程 之 前 终止 ， 那 么 父 进程 又 如 何 能 在 做 相应 检 
查 时 得 到 子 进程 的 终止 状态 呢 ? 对 此 问题 的 回答 是 : 内核 为 每 个 终止 子 进程 保存 了 一 定量 的 信 
息 ， 所 以 当 终 止 进程 的 父 进程 调用 wait 或 waitpid 时 ， 可 以 得 到 这 些 信息 。 这 些 信息 至 少 包 
括 进程 ID、 该 进程 的 终止 状态 、 以 及 该 进程 使 用 的 CPU 时 间 总 量 。 内 核 可 以 释放 终止 进程 所 使 
用 的 所 有 存储 区 ， 关 闭 其 所 有 打开 文件 。 在 UNIX 术 语 中 ， 一 个 已 经 终止 、 但 是 其 父 进程 尚未 
对 其 进行 善后 处 理 (获取 终止 子 进程 的 有 关 信息 ， 释 放 它 仍 占用 的 资源 ) 的 进程 被 称 为 僵 死 进 
42 (zombie)。ps(1) 命 令 将 伪 死 进程 的 状态 打印 为 Z。 如 果 编 写 一 个 长 期 运行 的 程序 ， 它 调用 
fork 产 生 了 很 多 子 进程 ， 那 么 除非 父 进程 等 待 取得 子 进程 的 终止 状态 ， 否 则 这 些 子 进程 终止 
后 就 会 变 成 价 死 进程 。 

某 些 系统 提供 了 一 种 避免 产生 伪 死 进程 的 方法 ， 这 将 在 10.7 节 中 介绍 。 


最 后 一 个 要 考虑 的 问题 是 : 一 个 由 init 进 程 领养 的 进程 终止 时 会 发 生 什么 ? 它 会 不 会 变 
成 一 个 优 死 进程 ? 对 此 问题 的 回答 是 “ 否 "， 因 为 init 被 编写 成 无 论 何 时 只 要 有 一 个 子 进程 终 
止 ，init 就 会 调用 一 个 wait 函 数 取得 其 终止 状态 。 这 样 也 就 防止 了 在 系统 中 有 很 多 僵 死 进程 。 
当 提 及 “一 个 init 的 子 进程 ”时 ， 这 指 的 可 能 是 init 直 接 产生 的 进程 〈( 例 如， 将 在 9.2 节 说 明 
的 getty 进 程 )， 也 可 能 是 其 父 进程 已 终止 ， 由 init 领 养 的 进程 。 


8.6 wait 和 waitpida 函 数 


当 一 个 进程 正常 或 异常 终止 时 ， 内 核 就 向 其 父 进程 发 送 SIGCHLD 信 和 号。 因为 子 进 程 终止 是 
个 异步 事件 (这 可 以 在 父 进程 运行 的 任何 时 候 发 生 ) ， 所 以 这 种 信号 也 是 内 核 向 父 进程 发 的 异 
步 通知 。 父 进程 可 以 选择 忽略 该 信号 ， 或 者 提供 一 个 该 信号 发 生 时 即 被 调用 执行 的 函数 (信和 号 
处 理 程 序 )。 对 于 这 种 信号 的 系统 默认 动作 是 忽略 它 。 第 10 章 将 说 明 这 些 选项 。 现 在 需要 知道 
的 是 调用 wait 或 waitpid 的 进程 可 能 会 发 生 什么 情况 : 

。 如 果 其 所 有 子 进程 都 还 在 运行 ， 则 阻塞 。 

" 如果 一 个 子 进程 已 终止 ， 正 等 待 父 进程 获取 其 终止 状态 ， 则 取得 该 子 进程 的 终止 状态 立 

即 返 回 。 

。 如 果 它 没有 任何 子 进程 ， 则 立即 出 错 返 回 。 
如 果 进 程 由 于 接收 到 SIGCHLD 信 和 号 而 调用 wait， 则 可 期 望 wait 会 立即 返回 。 但 是 如 果 在 任意 
时 刻 调 用 wait， 则 进程 可 能 会 阻塞 。 


#include «sys/wait.h» 


pid_t wait (int *statloc) ; 


pid_t waitpid(pid_t pid, int *statloc, int options) ; 


两 个 函数 返回 值 ， 若 成 功 则 返回 进程 ID. 0 ( 见 后 面 的 说 明 )， 若 出 错 则 返回 ~1 





这 两 个 函数 的 区 别 如 下 : 
* 在 一 个 子 进程 终止 前 ，wait 使 其 调用 者 阻塞 ， 而 waitpida 有 一 个 选项 ， 可 使 调用 者 不 阻塞 。 
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。waitpid 并 不 等 待 在 其 调用 之 后 的 第 一 个 终止 子 进程 ， 它 有 若干 个 选项 ， 可 以 控制 它 所 

等 待 的 进程 。 . 
如 果 一 个 子 进程 已 经 终止 ， 并 且 是 一 个 僵 死 进程 ， 则 wait 立 即 返回 并 取得 该 子 进程 的 状态 ， 
否则 wait 使 其 调用 者 阻塞 直到 一 个 子 进程 终止 。 如 调用 者 阻塞 而 且 它 有 多 个 子 进 程 ， 则 在 其 
一 个 子 进 程 终止 时 ，wait 就 立即 返回 。 因 为 wait 返 回 终 止 子 进程 的 进程 站， 所 以 它 总 能 了 解 

220| ”是 哪 一 个 子 进程 终止 了 。 

这 两 个 函数 的 参数 statloc 是 一 个 整 型 指针 。 如 果 statlioc 不 是 一 个 空 指 针 ， 则 终止 进程 的 终 
止 状态 就 存放 在 它 所 指向 的 单元 内 。 如 果 不 关 心 终止 状态 ， 则 可 将 该 参数 指定 为 空 指针 。 

依据 传统 ， 这 两 个 国 数 返 回 的 整 型 状态 字 是 由 实现 定义 的 。 其 中 某 些 位 表示 退出 状态 OE 
常 返回 )， 其 他 位 则 指示 信号 编号 (异常 返回 )， 有 一 位 指示 是 否 产 生 了 一 个 core 文 件 等 。 
POSIX.1 规 定 终止 状态 用 定义 在 <sys /wait .h> 中 的 各 个 宏 来 查看 。 有 四 个 互 斥 的 宏 可 用 来 取 
得 进程 终止 的 原因 ， 它 们 的 名 字 都 以 WIF 开 始 。 基 于 这 四 个 宏 中 哪 一 个 值 为 真 ， 就 可 选用 其 他 
宏 来 取得 终止 状态 、 信 号 编号 等 。 这 四 个 互 斥 的 宏 示 于 表 8-1 中 。 

在 9.8 节 中 讨论 作业 控制 时 ， 将 说 明 如 何 停止 一 个 进程 。 


表 8-1 检查 wait 和 waitpid 所 返回 的 终止 状态 的 宏 


(status)， 取 子 进程 传送 给 exit、_exit 或 _Exit 参 数 的 低 8 位 


WIFSIGNALED (status) 车 为 异常 终止 子 进程 返回 的 状态 ， 则 为 真 〈 接 到 一 个 不 捕捉 的 信号 )。 对 于 这 
种 情况 ， 可 执行 WTERMSIG (status)， 取 使 子 进程 终止 的 信号 编号 。 另 外 ， 有 些 
实现 ( 非 Single UNIX Specification) 定义 宕 WCOREDUMP (status), OPR 
止 进程 的 core 文 件 ， 则 它 返 回 真 


WIFSTOPPED (status) 车 为 当前 暂停 子 进程 的 返回 的 状态 ， 则 为 真 。 对 于 这 种 情况 ， 可 执行 WSTOPSIG 
(status)， 取 使 子 进程 暂停 的 信号 编号 

WIFCONTINUED (status) 车 在 作业 控制 暂停 后 已 经 继续 的 子 进程 返回 了 状态 ， 则 为 真 。(POSIX.1 的 XSI 
PH, MAFwaitpid,) 


eee 


| 
若 为 正常 终止 子 进程 返回 的 状态 ， 则 为 真 。 对 于 这 种 情况 可 执行 WEXITSTATUS 








程序 清单 8-3 中 的 函数 pr_exit 使 用 表 8-! 中 的 宏 以 打印 进程 终止 状态 的 说 明 。 本 书 中 的 很 
多 程序 都 将 调用 此 函数 。 注 意 ， 如 果 定 义 了 WCOREDUMP 宏 ， 则 此 函数 也 处 理 该 宏 。 


程序 清单 8-3 打印 extt 状 态 的 说 明 


#include "apue.h" 
#include «sys/wait.h» 


void 
pr_exit (int status) 


if (WIFEXITED (status) ) 
printf ("normal termination, exit status = $d\n", 
WEXITSTATUS (status) ) ; 
else if (WIFSIGNALED (status) ) 
printf ("abnormal termination, signal number = $dts\n", 
WTERMSIG (status), 
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#ifdef WCOREDUMP 
WCOREDUMP (status) ? " (core file generated)" : ""); 

#else 
ule ) $ 

#endif 

else if (WIFSTOPPED (status) ) 
printf ("child stopped, signal number = %d\n", 

WSTOPSIG(status) ); 


FreeBSD 5.2.1, Linux 2.4.22, Mac OS X 10.34eSolaris 94% $i HWCOREDUMP ZZ , 


程序 清单 8-4 中 的 程序 调用 pr_exit 函 数 ， 演 示 终 止 状态 的 各 种 值 。 运 行 该 程序 可 得 


$ ./a.out 

normal termination, exit status - 7 

abnormal termination, signal number - 6 (core file generated) 
abnormal termination, signal number - 8 (core file generated) 


不 幸 的 是 ， 没 有 一 种 可 移植 的 方法 将 WTERMSIG 得 到 的 信号 编号 映射 为 说 明 性 的 名 字 (10.214 
中 说 明了 一 -种 方法 ) 。 我 们 必须 查看 <signal .h> 头 文件 才能 知道 SIGABRT 的 值 是 6，SIGFPE 
的 值 是 8。 图 


程序 清单 8-4 演示 不 同 的 exit 值 


#include "apue.h" 
#include «sys/wait.h» 


int 

main (void) 

{ 
pid t pid; 
int Status; 


if ((pid = fork()) < 0) 
err_sys ("fork error"); 


else if (pid == 0) /* child */ 
exit (7) ; 

if (wait (&status) !- pid) /* wait for child */ 
err_sys("wait error"); 

pr_exit (status) ; /* and print its status */ 


if ((pid = fork()) « 0) 
err_sys("fork error"); 


else if (pid == 0) /* child */ 
abort () ; /* generates SIGABRT */ 

if (wait (&status) !- pid) /* wait for child */ 
err_sys("wait error") ; 

pr_exit (status) ; /* and print its status */ 


if ((pid = fork()) « 0) 
err sys("fork error"); 


else if (pid == 0) /* child */ 

status /- 0; /* divide by 0 generates SIGFPE */ 
if (wait(&status) !- pid) /* wait for child */ 

err sys("wait error"); 
pr exit (status); /* and print its status */ 
exit(0); 
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正如 前 面 所 述 ， 如 果 一 个 进程 有 几 个 子 进程 ， 那 么 只 要 有 一 个 子 进 程 终 止 ，wait 就 返回 。 
如 果 要 等 待 一 个 指定 的 进程 终止 (如果 知 道 要 等 待 进程 的 ID ) ， 那 么 该 如 何 做 呢 ? 在 早期 的 
UNIX 版 本 中 ， 必 须 调 用 wait， 然 后 将 其 返回 的 进程 ID 和 所 期 望 的 进程 ID 相 比较 。 如 果 终 止 进 
程 不 是 所 期 望 的 ， 则 将 该 进程 ID 和 终止 状态 保存 起 来 ， 然 后 再 次 调用 wait。 反 复 这 样 做 直到 
所 期 望 的 进程 终止 。 下 一 次 又 想 等 待 一 个 特定 进程 时 ， 先 查看 已 终止 的 进程 列表 ， 若 其 中 已 有 
要 等 待 的 进程 ， 则 取 有 关 信 息 ， 否 则 调用 wait。 其 实 ， 我 们 需要 的 是 等 待 一 个 特定 进程 的 函 
数 。POSIX.1 定 义 了 waitpid 函 数 以 提供 这 种 功能 (以 及 其 他 一 些 功 能 )。 

对 于 wai tpig 函 数 中 pid 参 数 的 作用 解释 如 下 : 

Pid== 一 1 等待 任 一 子 进程 。 就 这 一 方面 而 言 ，waitpid 与 wait 等 效 。 

pid>0 等 待 其 进程 ID 与 pid 相 等 的 子 进程 。 

pid == 等 待 其 组 ID 等 于 调用 进程 组 了 的 任 一 子 进程 。(9.4 节 将 说 明 进 程 组 。) 

pid« 1 — 等待 其 组 了 等 于 pid 绝 对 值 的 任 一 子 进程 。 

wai tpid 函 数 返 回 终止 子 进程 的 进程 ID， 并 将 该 子 进程 的 终止 状态 存放 在 由 statloc 指 向 的 
存储 单元 中 。 对 于 wait， 其 唯一 的 出 错 是 调用 进程 没有 子 进程 (函数 调用 被 一 个 信号 中 断 时 ， 
也 可 能 返回 另 一 种 出 错 。 第 10 章 将 对 此 进行 讨论 )。 但 是 对 于 wai tpida， 如 果 指 定 的 进程 或 进 
程 组 不 存在 ， 或 者 参数 pid 指 定 的 进程 不 是 调用 进程 的 子 进程 则 都 将 出 错 。 

options 参 数 使 我 们 能 进一步 控制 waitpid 的 操作 。 此 参数 可 以 是 9， 或 者 是 表 8-2 中 常量 按 
位 “或 ”运算 的 结果 。 


表 8-2 waitpid 的 options 常 量 





WCONTINUED 








若 实现 支持 作业 控制 . 那么 由 pid 指 定 的 任 一 子 进程 在 暂停 后 已 经 继续 , 但 其 状态 尚未 报告 ， 
则 返回 其 状态 (POSIX.1 的 XSI 扩 展 ) 

若 由 pia 指 定 的 子 进程 并 不 是 立即 可 用 的 ， 则 waitpid 不 阻塞 ， 此 时 其 返回 值 为 0 

若 某 实现 支持 作业 控制 ， 而 由 pid 指 定 的 任 一 子 进程 已 处 于 暂停 状态 、 并 且 其 状态 自 暂 停 以 
来 还 未 报告 过 ， 则 返回 其 状态 。wIFSTOPPED 宏 确定 返回 值 是 否 对 应 于 一 个 暂停 子 进程 











WNOHANG 
WUNTRACED 








Solaris 支 持 另 一 个 但 非 标 准 的 选项 常量 WNOWAIT， 它 使 系统 将 终止 状态 已 由 waitpid 返 回 的 进程 
保持 在 等 待 状态 ， 这 样 它 可 被 再 次 等 待 。 


waitpid 函 数 提供 了 wait 函 数 没 有 提供 的 三 个 功能 : 

(1) waitpid 可 等 待 一 个 特定 的 进程 ， 而 wait 则 返回 任 一 终止 子 进程 的 状态 。 在 讨论 popen 
函数 时 会 再 说 明 这 一 功能 。 

(2) waitpid 提 供 了 一 个 wait 的 非 阻塞 版 本 。 有 时 用 户 希 望 取得 一 个 子 进 程 的 状态 ， 但 不 
想 阻 塞 。 

(3) waitpid 支 持 作 业 控 制 (Fl 用 WUNTRACED 和 WCONTINUED 选 项 )。 


实 例 


回忆 8.5 他 中 有 关 僵 死 进程 的 讨论 。 如 果 一 个 进程 fork 一 个 子 进程 ， 但 不 要 它 等 待 子 进程 
终止 ， 也 不 希望 子 进程 处 于 僵 死 状态 直到 父 进程 终止 ， 实 现 这 一 要 求 的 技巧 是 调用 fork 两 次 。 
程序 清单 8-5 实 现 了 这 一 点 。 
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程序 清单 8-5 调用 fcrk 两 次 以 避免 僵 死 进程 


#include "apue.h" 
#include «sys/wait.h» 


int 
main (void) 


pid t pid; 


if ((pid = fork0) < 0) { 
err sys("fork error"); 
) else if (pid == 0) { /* first child */ 
if ((pid = fork()) < 0) 
err sys("fork error"); 
else if (pid > 0) 
exit (0); /* parent from second fork == first child */ 


* We're the second child; our parent becomes init as soon 
* as our real parent calls exit() in the statement above. 
* Here's where we'd continue executing, knowing that when 
* we're done, init will reap our status. 


*/ 
sleep (2); 
printf ("second child, parent pid = %d\n", getppid()); 
exit (0); 
} 
if (waitpid(pid, NULL, 0) != pid) /* wait for first child */ 


err sys("waitpid error"); 
/* 
* We're the parent (the original process); we continue executing, 
* knowing that we're not the parent of the second child. 


*j 
exit (0); 


第 二 个 子 进程 调用 sleep 以 保证 在 打印 父 进程 ID 时 第 一 个 子 进程 已 终止 。 在 fork 之 后 ， 
父 、 子 进程 都 可 继续 执行 ， 并 且 我 们 无 法 预知 哪 一 个 会 先 执行 。 在 fork 之 后 ， 如 果 不 使 第 二 
个 子 进程 休眠 ， 那 么 它 可 能 比 其 父 进程 先 执行 ， 于 是 它 打印 的 父 进程 卫 将 是 创建 它 的 父 进程 ， 
而 不 是 init 进 程 (进程 ID 1), 

执行 程序 清单 8-5 中 的 程序 得 到 : 


$ ./a.out 
$ second child, parent pid = 1 


注意 ， 当 原先 的 进程 〈 也 就 是 exec 本 程序 的 进程 ) 终止 时 ，shell 打 印 其 提示 符 ， 这 在 第 二 个 子 
进程 打印 其 父 进程 ID 之 前 。 口 


8.7 waitid 函 数 


Single UNIX Specification 的 XSI 扩 展 包括 了 另 一 个 取 进 程 终止 状态 的 函数 一 一 waitid， 此 
函数 类 似 于 waitpid， 但 提供 了 更 多 的 灵活 性 。 
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#include «sys/wait.h» 


int waitid(idtype t idtype, id t id, siginfo t *infop, int options); 
返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 -1 
与 waitpid 相 似 ，waitigd 允 许 一 个 进程 指定 要 等 待 的 子 进程 。 但 它 使 用 单独 的 参数 表示 
要 等 待 的 子 进程 的 类 型 ， 而 不 是 将 此 与 进程 ID 或 进程 组 ID 组 合成 一 个 参数 。id 参 数 的 作用 与 
idpDpe 的 值 相 关 。 该 函数 支持 的 idppe 类 型 列 出 在 表 8-3 中 。 


表 8-3 ”waitiad 的 idtype 常 量 





等 待 一 个 特定 的 进程 .id 包含 要 等 待 子 进程 的 进程 ID 


等 待 一 个 特定 进程 组 中 的 任 一 子 进程 id 包含 要 等 待 子 进程 的 进程 组 ID 
等 待 任 --… 子 进程 忽略 id 


options 参 数 是 表 8-4 中 各 标志 的 按 位 “或 "。 这 些 标志 指示 调用 者 关注 哪些 状态 变化 。 


表 8-4 ”waitid 的 opftions 常 量 















WCONTINUED 等 待 一 个 进程 ， 它 以 前 曾 被 暂停 ,此 后 又 已 继续 ， 但 其 状态 尚未 报告 
WEXITED 等 待 已 退出 的 进程 

WNOHANG 如 无 可 用 的 子 进程 退出 状态 ， 立 即 返 回 而 非 阴 塞 

WNOWAIT 不 破坏 子 进程 退出 状态 。 该 子 进程 退出 状态 可 由 后 续 的 wait、waitia 或 waitpig 调 用 取得 
WSTOPPED 等 待 一 个 进程 ， 它 已 经 暂停 ， 但 其 状态 尚未 报告 























infop 参 数 是 指向 siginfo 结 构 的 指针 。 该 结构 包含 了 有 关 引 起 子 进程 状态 改变 的 生成 信 
号 的 详细 信息 。10.14 节 将 进一步 讨论 siginfo 结 构 。 


本 书 讨论 的 四 种 平台 中 只 有 Solaris 支 持 waitid。 


8.8 wait3 和 wait4 函 数 


大 多 数 UNIX 系 统 实现 提供 了 另外 两 个 函数 wait3 和 wait4。 历 史上 ， 这 两 个 函数 是 从 
UNIX 系 统 的 BSD 分 支 沿袭 下 来 的 。 它 们 提供 的 功能 比 POSIX.1 函 数 wait、wai tpig 和 
waitid 所 提供 的 功能 要 多 一 个 ， 这 与 附加 参数 rusage 有 关 。 该 参数 要 求 内 核 返 回 由 终止 进程 
及 其 所 有 子 进程 使 用 的 资源 汇总 。 
#include <sys/types.h> 
#include <sys/wait.h> 


#include <sys/time.h> 
#include <sys/resource.h> 









pid t wait3(int *statloc, int options, struct rusage *rusage) ; 


pid t wait4(pid t pid, int *statloc, int options, struct rusage *rusage) ; 


BDAB ENA: 车 成 功 则 返回 进程 ID， 若 出 错 则 返 同 -1 


资源 统计 信息 包括 用 户 CPU 时 间 总 量 、 系 统 CPU 时 间 总 量 、 页 面 出 错 次 数 、 接 收 到 信号 的 
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次 数 等 。 有 关 细 节 请 参阅 getrusage(2) 手 册页 (这 种 资源 信息 与 7.11 节 中 所 述 的 资源 限制 不 
同 )。 表 8-5 列 出 了 各 个 wait 函 数 所 支持 的 参数 。 


表 8-5 不 同系 统 上 各 个 wait 函 数 所 支持 的 参数 


POSIX.1 | Free BSD 5.2.1 Linux 2.4.22 MacOSX 10.3 Solaris 9 


wait » 
waitid XSI 
wait3 
EID NI i 
Single UNIX Specification 的 早期 版 本 包括 wait3 函 数 。 在 其 版 本 2 中 ，wait3 被 移 到 了 遗留 目录 下 ， 
在 其 版 本 3 中 ， 则 删 去 了 wait3。 


8.9 竞争 条 件 


从 本 书 的 目的 出 发 ， 当 多 个 进程 都 企图 对 共享 数据 进行 某 种 处 理 ， 而 最 后 的 结果 又 取决 于 
进程 运行 的 顺序 时 ， 则 我 们 认为 这 发 生 了 竞争 条 件 (race condition) 。 如 果 在 Eork 之 后 的 某 种 
逻辑 显 式 或 隐 式 地 依赖 于 在 fork 之 后 是 父 进程 先 运行 还 是 子 进程 先 运行 ， 那 么 fork 函 数 就 会 
是 竞争 条 件 活跃 的 滋生 地 。 通 常 ， 我 们 不 能 预料 哪 一 个 进程 先 运行 。 即 使 知道 哪 一 个 进程 先 运 
行 ， 那 么 在 该 进程 开始 运行 后 ， 所 发 生 的 事情 也 依赖 于 系统 负载 以 及 内 核 的 调度 算法 。 

在 程序 清单 8-5 中 ， 当 第 二 个 子 进程 打印 其 父 进程 ID 时 ， 我 们 看 到 了 一 个 潜在 的 竞争 条 件 。 
如 果 第 二 个 子 进程 在 第 一 个 子 进程 之 前 运行 ， 则 其 父 进程 将 会 是 第 一 个 子 进程 。 但 是 ， 如 果 第 
一 个 子 进程 先 运行 ， 并 有 足够 的 时 间 到 达 并 执行 exit， 则 第 二 个 子 进程 的 父 进程 就 是 init。 
即使 在 程序 中 调用 sleep， 这 也 不 会 保证 什么 。 如 果 系 统 负载 很 重 ， 那 么 在 第 二 个 子 进程 从 
sleep 返 回 时 ， 可 能 第 一 个 子 进程 还 没有 得 到 机 会 运行 。 这 种 形式 的 问题 很 难 排除 ， 因 为 在 大 
部 分 时 间 ， 这 种 问题 并 不 会 出 现 。 

如 果 一 个 进程 希望 等 待 一 个 子 进程 终止 ， 则 它 必 须 调用 一 种 wait 函 数 。 如 果 一 个 进程 要 
等 待 其 父 进 程 终止 (如 程序 清单 8-5 中 一 样 )， 则 可 使 用 下 列 形式 的 循环 : 

while (getppid() != 1) 

sleep (1) ; 
这 种 形式 的 循环 ( 称 为 轮 询 (polling) ) 的 问题 是 它 浪费 了 CPU 时 间 ， 因 为 调用 者 每 隔 1 秒 都 被 
唤醒 ， 然 后 进行 条 件 测试 。 

为 了 避免 竞争 条 件 和 轮 询 ， 在 多 个 进程 之 间 需 要 有 某 种 形式 的 信号 发 送 和 接收 的 方法 。 在 
UNIX 中 可 以 使 用 信号 机 制 ， 在 10.16 节 将 说 明 它 在 解决 此 方面 问题 的 一 种 用 法 。 也 可 使 用 各 种 
形式 的 进程 间 通信 (IPC)， 在 第 15 和 17 章 将 对 此 进行 讨论 。 

在 父 、 子 进程 的 关系 中 ， 常 常 出 现下 述 情况 。 在 调用 fork 之 后 ， 父 、 子 进程 都 有 一 些 事 
青 要 做 。 例 如 ， 父 进程 可 能 要 用 子 进 程 ID 更 新 日 志文 件 中 的 一 个 记录 ， 而 子 进程 则 可 能 要 为 父 
进程 创建 一 个 文件 。 在 本 例 中 ， 要 求 每 个 进程 在 执行 完 它 的 一 套 初始 化 操作 后 要 通知 对 方 ， 并 
且 在 继续 运行 之 前 ， 要 等 待 另 一 方 完成 其 初始 化 操作 。 这 种 方案 可 以 用 代码 描述 如 下 : 


#include  "apue.h" 

























bbs.theithome.com 


N 





228 








186 第 8 章 进程 控制 


TELL WAIT(); /* set things up for TELL xxx & WAIT xxx */ 


if ((pid = fork()) « 0) { 
err_sys("fork error") ; 


} else if (pid == 0) { /* child */ 
/* child does whatever is necessary ... */ 
TELL PARENT (getppid()); /* tell parent we're done */ 
WAIT PARENT(); /* and wait for parent */ 
/* and the child continues on its way ... */ 
exit (0); 
} 
/* parent does whatever is necessary ... */ 
TELL_CHILD (pid) ; /* tell child we're done */ 
WAIT CHILD(); /* and wait for child */ 
/* and the parent continues on its way ... */ 
exit (0); 


假定 在 头 文件 apue .h 中 定义 了 各 个 需要 使 用 的 变量 。5 个 例 程 TELL_WAIT、TELL_ PARENT, 
TELL CHILD, WAIT_PARENTLJ BWAIT_CHILDW WEF, HALE. 

在 后 面 儿 章 中 会 说 明 实现 这 些 TELL 和 WwWaIT 例 程 的 不 同方 法 : 10.16 节 中 说 明 使 用 信号 的 一 
种 实现 ， 程 序 清 单 15-3 说 明 使 用 管道 的 一 种 实现 。 下 面 先 看 一 个 使 用 这 5 个 例 程 的 实例 。 








程序 清单 8-6 输 出 两 个 字符 串 : 一 个 由 子 进程 输出 ， 另 一 个 由 父 进程 输出 。 因 为 输出 依赖 于 内 
核 使 这 两 个 进程 运行 的 顺序 及 每 个 进程 运行 的 时 间 长 度 ， 所 以 该 程序 包含 了 一 个 竞争 条 件 。 


程序 清单 8-6 具有 竞争 条 件 的 程序 





#include "apue.h" 
Static void charatatime(char *); 


int 
main(void) 


{ 


pid t pid; 


if ((pid = fork()) « 0) { 
err_sys("fork error") ; 
) eise if (pid == 0) ( 
charatatime("output from child\n") ; 
) eise { 
charatatime ("output from parent An"); 
} 


exit (0); 


} 


Static void 
charatatime(char *str) 


{ 
char *ptr; 
int ci 
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setbuf (stdout, NULL); /* set unbuffered */ 
for (ptr = str; (c = *ptr++) != 0; ) 
putc(c, stdout); 





在 程序 中 将 标准 输出 设置 为 不 带 缓冲 的 ， 于 是 每 个 字符 输出 都 需 调用 一 次 write。 本 例 的 
目的 是 使 内 核能 尽 可 能 地 在 两 个 进程 之 间 进 行 多 次 切换 ， 以 便 演 示 竞 争 条 件 。( 如 果 不 这 样 做 ， 
可 能 也 就 决 不 会 见 到 下 面 所 示 的 输出 。 没 有 看 到 具有 错误 的 输出 并 不 意味 着 竞争 条 件 不 存在 ， 
这 只 是 意味 着 在 此 特定 的 系统 上 未 能 见 到 它 。) 下 面 的 实际 输出 说 明 该 程序 的 运行 结果 是 可 以 
改变 的 。 

$ ./a.out 

ooutput from child 

utput from parent 

$ ./a.out 

ooutput from child 

utput from parent 

$ ./a.out 


output from child 
output from parent 


修改 程序 清单 8-6， 以 使 用 TELL 和 wAIT 函 数 ， 于 是 形成 了 程序 清单 8-7。 行 首 标 以 + 号 的 行 
是 新 增加 的 行 。 


程序 清单 8-7 修改 程序 清单 8-6 以 避免 竞争 条 件 

#include "apue.h" 
static void charatatime(char *); 
int 
main (void) 

pid t pid; 

+ TELL WAIT(); 
if ((pid = fork()) < 0) { 


err_sys("fork error"); 
} else if (pid == 0) { 


+ WAIT PARENT(); /* parent goes first */ 
charatatime("output from child\n"); 
} else { 
charatatime("output from parent\n") ; 
5 TELL CHILD (pid) ; 
} 
exit (0); 
} 


static void 
charatatime (char *str) 


{ 
char *ptr; 
int C 
setbuf (stdout, NULL); /* set unbuffered */ 
for (ptr = str; (c = *ptr++) != 0; ) 
putc(c, stdout); 
} 


一 LLL 
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运行 此 程序 则 能 得 到 所 预期 的 输出 ， 两 个 进程 的 输出 不 再 交叉 混合 。 
程序 清单 8-7 是 使 父 进程 先 运行 。 如 果 将 fork 之 后 的 行 改变 成 


} else if (pid == 0) { 
charatatime ("output from child\n"); 
TELL PARENT (getppid{()); 
} else { 
WAIT CHILD(); /* child goes first */ 
charatatime("output from parent\n") ; 


则 子 进程 先 运行 。 习 题 8.3 继 续 这 一 实例 。 口 
8.10 ” exec 函数 


8.3 节 曾 提 及 用 fork 函 数 创建 子 进程 后 ， 子 进程 往往 要 调用 一 种 exec 函 数 以 执行 另 一 个 程 
序 。 当 进程 调用 一 种 exec 函 数 时 ， 该 进程 执行 的 程序 完全 替换 为 新 程序 ， 而 新 程序 则 从 其 
main 函 数 开始 执行 。 因 为 调用 exec 并 不 创建 新 进程 ， 所 以 前 后 的 进程 卫 并 未 改变 。exec 只 是 
用 一 个 全 新 的 程序 替换 了 当前 进程 的 正文 、 数 据 、 堆 和 栈 段 。 

有 6 种 不 同 的 exec 函 数 可 供 使 用 ， 它 们 常常 被 统称 为 exec 函 数 。 这 些 exec 函 数 使 得 UNIX 
进程 控制 原 语 更 加 完善 。 用 fork 可 以 创建 新 进程 ， 用 exec 可 以 执行 新 程序 。exit 函 数 和 两 个 
wait 函 数 处 理 终止 和 等 待 终止 。 这 些 是 我 们 需要 的 基本 的 进程 控制 原 语 。 在 后 面 各 节 中 将 使 
用 这 些 原 语 构造 另外 一 些 如 popen 和 system 之 类 的 函数 。 


#include <unistd.h> 
int exec] (const char *pathname, const char *arg0, ... /* (char *)0 */ ); 
int execv(const char *pathname, char *const arguv(]); 


int execle(const char *pathname, const char *arg0, .. 
/* (char *)0, char *const envp[] */ ); 


int execve (const char *pathname, char *const argv(], char *const envp[]); 


int execlp(const char ‘filename, const char *argü, ... /* (char *)0 */ ); 


int execvp(const char *filename, char *const argv(1); 


6 个 函数 返回 值 ， 若 出 错 则 返回 -1， 若 成 功 则 不 返回 值 





这 些 函 数 之 间 的 第 一 个 区 别 是 前 4 个 取 路 径 名 作为 参数 ， 后 两 个 则 取 文件 名 作为 参数 。 当 指定 
filename 作 为 参数 时 : 

。 如 果 filename 中 包含 /， 则 将 其 视 为 路 径 名 。 

“否则 就 按 PATH 环 境 变 量 ， 在 它 所 指定 的 各 目录 中 搜寻 可 执行 文件 。 
PATH 变量 包含 了 一 张 目录 表 ( 称 为 路 径 前 缀 ) ， 目 录 之 间 用 冒号 (C) OM. Bia, name = 
values E T3 88 


, PATH» /bin:/usr/bin:/usr/local/bin/:. 


指定 在 4 个 目录 中 进行 搜索 。 最 后 的 路 径 前 级 表示 当前 目录 。( 零 长 前 缀 也 表示 当前 目录 。 在 
value 的 开始 处 可 用 :表示 ， 在 行 中 间 则 要 用 : : 表示 ， 在 行 尾 则 以 :表示 。) 
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出 于 安全 性 方面 的 考虑 ， 有 些 人 要 求 在 搜索 路 径 中 次 不 要 包括 当前 目录 。 请 参见 Garfinkel 等 
[2003], 


如 果 execlp 或 execvp 使 用 路 径 前 级 中 的 一 个 找到 了 一 个 可 执行 文件 ， 但 是 该 文件 不 是 由 
连接 编辑 器 产生 的 机 器 可 执行 文件 ， 则 认为 该 文件 是 一 个 shell 脚 本 ， 于 是 试 着 调用 /bin/sh， 
并 以 该 filename 作 为 shell 的 输入 。 

第 二 个 区 别 与 参数 表 的 传递 有 关 (1 表示 1i st，v 表 示 矢 量 vector)。 函 数 execl、 
execlp 和 execle 要 求 将 新 程序 的 每 个 命令 行 参数 都 说 明 为 一 个 单独 的 参数 。 这 种 参数 表 以 空 
指针 结尾 。 对 于 另外 三 个 函数 (execv、execvp 和 execve)， 则 应 先 构造 一 个 指向 各 参数 的 
KETA, ， 然 后 将 该 数组 地 址 作为 这 三 个 函数 的 参数 。 

在 使 用 ISO C 原 型 之 前 ， 对 execl、execle 和 execlp 三 个 函数 表示 命令 行 参数 的 一 般 方 
法 是 

char *arg0, char *argl, ..., char *argn, (char *)0 
应 当 特 别 指出 的 是 : 在 最 后 一 个 命令 行 参 数 之 后 跟 了 一 个 空 指针 。 如 果 用 常数 0 来 表示 一 个 空 
间 针 ， 则 必须 将 它 强制 转换 为 一 个 字符 指针 ， 和 否则 将 它 解 释 为 整 型 参数 。 如 果 一 个 整 型 数 的 长 
度 与 char * 的 长 度 不 同 ， 那 么 exec 函 数 的 实际 参数 就 将 出 错 。 

最 后 一 个 区 别 与 向 新 程序 传递 环境 表 相 关 。 以 e 结 尾 的 两 个 函数 (execle 和 execve) 可 
以 传递 一 个 指向 环境 字符 串 指针 数组 的 指针 。 其 他 四 个 函数 则 使 用 调用 进程 中 的 environ 变 量 
为 新 程序 复制 现 有 的 环境 (回忆 7.9 节 及 表 7-2 中 对 环境 字符 串 的 讨论 。 其 中 曾 提 及 如 果 系 统 支 


持 setenv 和 putenv 这 样 的 函数 ， 则 可 更 改 当前 环境 和 后 面 生 成 的 子 进程 的 环境 ， 但 不 能 影响 


父 进程 的 环境 )。 通 常 ， 一 个 进程 允许 将 其 环境 传播 给 其 子 进程 ， 但 有 时 也 有 这 种 情况 ， 即 进 
程 想 要 为 子 进程 指定 某 一 个 确定 的 环境 。 例 如 ， 在 初始 化 一 个 新 登录 的 shell 时 ，1ogin 程 序 通 
常 创建 一 个 只 定义 少数 几 个 变量 的 特殊 环境 ， 而 在 我 们 登录 时 ， 可 以 通过 shell 启 动 文件 ， 将 其 
他 变量 加 到 环境 中 。 

在 使 用 ISO C 原 型 之 前 ，execle 的 参数 是 


char *pathname, char *arg0, ..., char *argn, (char *)0, char *envp [] 


从 中 可 见 ， 最 后 一 个 参数 是 指向 环境 字符 串 的 各 字符 指针 构成 的 数组 的 地 址 。 而 在 ISO C 原 型 
中 ， 所 有 命令 行 参 数 、 空 指针 和 ervp 指 针 都 用 省 略 号 (...) 表示 。 

这 6 个 exec 函 数 的 参数 很 难 记忆 。 函 数 名 中 的 字符 会 给 我 们 一 些 帮助 。 字 母 p 表 示 该 函数 
取 filename 作 为 参数 ， 并 且 用 PATH 环 境 变 量 寻找 可 执行 文件 。 字 母 1 表示 该 函数 取 一 个 参数 表 ， 
它 与 字母 v 互 斥 。v 表 示 该 函数 取 一 个 argv[] 矢 量 。 最 后 ， 字 母 e 表 示 该 函数 取 ervp[] 数 组 ， 而 不 
使 用 当前 环境 。 表 8-6 显 示 了 这 6 个 函数 之 间 的 区 别 。 


表 8-6 ”6 个 exec 函 数 之 间 的 区 别 


execl 


execlp 


execle 
execv 

execvp 
execve 
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每 个 系统 对 参数 表 和 环境 表 的 总 长 度 都 有 一 个 限制 。 在 2.5.2 节 和 表 2-8 中 ， 这 种 限制 是 由 
ARG_MAX 给 出 的 。 在 POSIX.1 系 统 中 ， 此 值 至 少 是 4096 字 节 。 当 使 用 shell 的 文件 名 扩充 功能 产 
生 一 个 文件 名 表 时 ， 可 能 会 受到 此 值 的 限制 。 例 如 ， 命 令 


grep getrlimit /usr/share/man/*/* 
在 某 些 系统 上 可 能 产生 下 列 形式 的 shell 错 误 : 


Argument list too long 


由 于 历史 原因 ， 在 早期 的 系统 V 实 现 中 ， 此 限制 值 是 5120 字 节 。 在 早期 BSD 系 统 中 ， 此 限制 值 是 
20 480 和 守节。 在 当前 系统 中 ， 此 限制 值 要 大 得 多 。( 见 程序 清音 2-2 的 输出 ， 限 制 值 列 出 在 表 2-12 中 。) 


为 了 摆脱 对 参数 表 长 度 的 限制 ， 我 们 可 以 使 用 xargs(1) 命 令 ， 将 长 参数 表 分 解 成 几 部 分 。 
为 了 寻找 在 我 们 所 用 系统 手册 中 的 getzlimit， 我 们 可 以 用 


find /usr/share/man -type f -print | xargs grep getrlimit 


如 果 所 用 的 系统 手册 是 压缩 过 的 ， 则 可 使 用 

find /usr/share/man -type f -print | xargs bzgrep getrlimit 
对 于 finqQ 命 令 ， 我 们 使 用 选项 -type f 限 制 输出 列表 只 包含 普通 文件 。 这 样 做 的 原因 是 ， 
grep 命 令 不 能 在 目录 中 搜索 模式 ， 我 们 也 想 避 免 不 必 要 的 出 错 消息 。 

前 面 曾 提 及 在 执行 exec 后 ， 进 程 ID 没 有 改变 。 除 此 之 外 ， 执 行 新 程序 的 进程 还 保持 了 原 
进程 的 下 列 特征 : 

“进程 ID 和 父 进 程 ID。 

。 实 际 用 户 ID 和 实际 组 ID。 

*。 附 加 组 ID。 

* 进程 组 ID。 

* RHID, 

。 控 制 终端 。 

* P] Ph fe] A BY AAT BT 

。 当 前 工作 目录 。 

。 根 目录 。 

。 文 件 模式 创建 屏蔽 字 。 

"文件 锁 。 

“进程 信号 屏蔽 。 

“未 处 理 信 号。 

“资源 限制 。 

“tms_utime、tms_stime、tms_cutime 以 及 tms_cstime 值 。 

对 打开 文件 的 处 理 与 每 个 描述 符 的 执行 时 关闭 (close-on-exec) 标志 值 有 关 。 见 图 3-1 以 及 
3.14 节 中 对 FD_CLOEXEC 的 说 明 ， 进 程 中 每 个 打开 描述 符 都 有 一 个 执行 时 关闭 标志 。 若 此 标志 
设置 ， 则 在 执行 exec 时 关闭 该 描述 符 ， 否 则 该 描述 符 仍 打开 。 除 非特 地 用 fcnt1 设 置 了 该 标 
志 ， 否 则 系统 的 默认 操作 是 在 执行 exec 后 仍 保持 这 种 描述 符 打开 。 

POSIX.1 明 确 要 求 在 执行 exec 时 关闭 打开 的 目录 流 ( 见 4.21 节 中 所 述 的 opendir 函 数 )。 
这 通常 是 由 opendir 函 数 实现 的 ， 它 调用 fcnt1 函数 为 对 应 于 打开 目录 流 的 描述 符 设置 执行 时 
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注意 ， 在 执行 exec 前 后 实际 用 户 ID 和 实际 组 ID 保 持 不 变 ， 而 有 效 ID 是 否 改 变 则 取决 于 所 
执行 程序 文件 的 设置 用 户 ID 位 和 设置 组 了 DP 位 是 否 设置 。 如 果 新 程序 的 设置 用 户 ID 位 已 设置 ， 则 
有 效用 户 ID 变 成 程序 文件 所 有 者 的 DD， 否 则 有 效用 户 了 D 不 变 。 对 组 ID 的 处 理 方式 与 此 相同 。 
在 很 多 UNIX 实 现 中 ， 这 6 个 函数 中 只 有 execve 是 内 核 的 系统 调用 。 另 外 5 个 只 是 库 函 数 ， 
它们 最 终 都 要 调用 该 系统 调用 。 这 6 个 函数 之 间 的 关系 示 于 图 8-2 中 。 






建立 argv 


execve 


environ (系统 调用 ) 


图 8-2 6 个 exec 函 数 之 间 的 关系 


在 这 种 安排 中 ， 库 函数 execlp 和 execvp 使 用 PATH 环 境 变量 ， 查 找 第 一 个 包含 名 为 
filename 的 可 执行 文件 的 路 径 名 前 级 。 


quu 












程序 清单 8-8 演 示 了 exec 函 数 。 
程序 清单 8-8 exec MH 


#include "apue.h" 
#include «sys/wait.h» 


char *env init[] = ( "USER-unknown", "PATH=/tmp", NULL }; 


int 
main(void) 


pid t pid; 


if ((pid = fork0) < 0) ( 
err sys("fork error"); 
} else if (pid == 0) ( /* specify pathname, specify environment */ 
if (execle("/home/sar/bin/echoall", "echoall", "myargl", 
"MY ARG2", (char *)0, env init) « 0) 
err Sys("execle error"); 


) 


if (waitpid(pid, NULL, 0) « 0) 
err sys("wait error"); 


if ((pid = fork) < 0) { 
err_sys("fork error"); 
} else if (pid == 0) { /* specify filename, inherit environment */ 
if (execlp("echoall", "echoall", "only 1 arg", (char *)0) « 0) 
err sys("execlp error"); 


) 


| exit (0); 
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在 该 程序 中 先 调用 exec1le， 它 要 求 一 个 路 径 名 和 一 个 特定 的 环境 。 下 一 个 调用 的 是 
execlp， 它 用 一 个 文件 名 ,并 将 调用 者 的 环境 传送 给 新 程序 。execlp 在 这 里 能 够 工作 的 原因 
是 因为 目录 /home/sar/bin 是 当前 路 径 前 缀 之 一 。 注 意 ， 我 们 将 第 一 个 参数 (新 程序 中 的 
argv[0]) 设置 为 路 径 名 的 文件 名 分 量 。 某 些 shell 将 此 参数 设置 为 完整 的 路 径 名 。 这 只 是 一 个 
惯例 。 我 们 可 将 argv [0] 设 置 为 任何 字符 捉 。 当 1ogin 命 令 执行 shell 时 就 是 这 样 做 的 。 在 执行 
shell 之 前 , 1ogin 在 argv[0] 之 前 加 一 个 /作为 前 级 , 这 向 shell 指 明 它 是 作为 登录 shell 被 调用 的 。 
登录 shell 将 执行 启动 配置 文件 (start-up profile) 命令 ， 而 非 登录 shell 则 不 会 执行 这 些 命令 。 

程序 清单 8-8 中 要 执行 两 次 的 程序 echoal1 示 于 程序 清单 8-9 中 。 这 是 一 个 很 普通 的 程序 ， 
它 回 送 其 所 有 命令 行 参数 及 全 部 环境 表 。 

程序 清单 8-9 回 送 所 有 命令 行 参数 和 所 有 环境 字符 串 

#include "apue.h" 

int 

main(int argc, char *argv[]) 

int i 
char **ptr; 
extern char **environ; 


for (i = 0; i « argc; i++) /* echo all command-line args */ 
printf("argv[$d]: %s\n", i, argv[il); 


for (ptr = environ; *ptr != 0; ptr++) /* and all env strings */ 
printf("$sMn", *ptr); 


exit(0); 





执行 程序 清单 8-8 得 到 


$ ./a.out 
argv[0]: echoall 
argv[1]: myargi 
argv[2]: MY ARG2 
USER-unknown 
PATH-/tmp 
$ argv[0]: echoall 
argv[1]: only 1 arg 
USER=sar 
LOGNAME=sar 
SHELL=/bin/bash 

其 中 有 47 行 没有 显示 
HOME=/home/sar 


注意 ，shell 提 示 符 出 现在 第 二 个 exec 打 印 argv 10] 之 前 。 这 是 因为 父 进程 并 不 等 待 该 子 
进程 结束 。 口 


8.11 更 改 用 户 ID 和 组 ID 


在 UNIX 系 统 中 ， 特 权 (例如 能 改变 当前 日 期 的 表示 法 以 及 访问 控制 (例如 ， 能 否 读 、 写 
一 特定 文件 )) 是 基于 用 户 和 组 ID 的 。 当 程序 需要 增加 特权 ， 或 需要 访问 当前 并 不 允许 访问 的 
资源 时 ， 我 们 需要 更 换 自 己 的 用 户 ID 或 组 ID, 使 得 新 ID 具有 合适 的 特权 或 访问 权限 。 与 此 类 似 ， 
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当 程 序 需要 降低 其 特权 或 阻止 对 某 些 资源 的 访问 时 ， 也 需要 更 换 用 户 ID 或 组 ID， 从 而 使 新 ID 不 
具有 相应 特权 或 访问 这 些 资源 的 能 力 。 
一 般 而 言 ， 在 设计 应 用 程序 时 ， 我 们 总 是 试图 使 用 最 小 特权 (least privilege) 模型 。 依 照 
此 模型 ， 我 们 的 程序 应 当 只 具有 为 完成 给 定 任务 所 需 的 最 小 特权 。 这 减少 了 安全 性 受到 损害 的 
可 能 性 ， 这 种 安全 性 损害 是 由 恶意 用 户 试图 哄骗 我 们 的 程序 以 未 预料 的 方式 使 用 特权 所 造成 的 。 
可 以 用 setuid 函 数 设置 实际 用 户 ID 和 有 效用 户 ID。 与 此 类 似 ， 可 以 用 setgid 函 数 设置 
实际 组 ID 和 有 效 组 ID。 


#include <unistd.h> 


int setuid(uid_t uid); 


int setgid(gid t gid); 


两 个 函数 返回 值 : 若 成 功 则 返回 0， 若 出 错 则 返回 -1 


关于 谁 能 更 改 ID 有 若干 规则 。 现 在 先 考虑 有 关 改 变 用 户 ID 的 规则 (我 们 关于 用 户 ID 所 说 明 
的 一 切 都 适用 于 组 ID )。 

(1) 若 进 程 具有 超级 用 户 特权 ， 则 setuid 函 数 将 实际 用 户 ID、 有 效用 户 ID ， 以 及 保存 的 设 
置 用 户 ID 设置 为 wid。 

(2) 若 进程 没有 超级 用 户 特 权 ， 但 是 wxid 等 于 实际 用 户 ID 或 保存 的 设置 用 户 ID， 则 setuia 
只 将 有 效用 户 ID 设 置 为 wd。 不 改变 实际 用 户 ID 和 保存 的 设置 用 户 ID。 

(3) 如 果 上 面 两 个 条 件 都 不 满足 ， 则 将 errno 设 置 为 EPERM， 并 返回 一 1。 

在 这 里 假定 _POSIX_SAVED_IDS 为 真 。 如 果 没 有 提供 这 种 功能 ， 则 上 面 所 说 的 关于 保存 
的 设置 用 户 ID 部 分 都 无 效 。 


在 POSIX.1 2001 版 中 ,保存 的 ID 是 强制 性 特征。 而 在 较 旱 的 版 本 中 ， 它 们 是 可 选 的 。 为 了 天 清楚 
某 种 实现 是 否 支持 这 一 特征 ， 应 用 程序 在 编译 时 可 以 测试 常量 _POSIOX_SRAVED- IDS， 或 者 在 运行 时 以 
_SC_SAVED_IDS Jl Fl sysconf 函数 。 


关于 内 核 所 维护 的 三 个 用 户 ID， 还 要 注意 下 列 几 点 ; 

(1) 只 有 超级 用 户 进程 可 以 更 改 实际 用 户 ID。 通 常 ， 实 际 用 户 ID 是 在 用 户 登 录 时 ， 由 
login(l) 程 序 设置 的 ， 而 且 永 远 不 会 改变 它 。 因 为 1ogin 是 一 个 超级 用 户 进程 ， 当 它 调用 
setuid 时 ， 会 设置 所 有 三 个 用 户 ID。 

(2) 仅 当 对 程序 文件 设置 了 设置 用 户 ID 位 时 ，exec 函 数 才 会 设置 有 效用 户 ID。 如 果 设 置 用 
户 ID 位 没有 设置 ， 则 exec 函 数 不 会 改变 有 效用 户 ID， 而 将 其 维持 为 原先 值 。 任 何 时 候 都 可 以 
调用 setuid， 将 有 效用 户 ID 设 置 为 实际 用 户 ID 或 保存 的 设置 用 户 ID。 自 然 ， 不 能 将 有 效用 户 
ID 设 置 为 任意 随机 值 。 

(3) 保存 的 设置 用 户 ID 是 由 exec 复 制 有 效用 户 ID 而 得 来 的 。 如 果 设 置 了 文件 的 设置 用 户 ID 
位 ， 则 在 exec 根 据 文件 的 用 户 ID 设 置 了 进程 的 有 效用 户 ID 以 后 ， 就 将 这 个 副本 保存 起 来 。 

表 8-7 列 出 了 改变 这 三 个 用 户 ID 的 不 同方 法 。 

注意 , 8.2 节 中 所 述 的 getuid 和 geteuid 函 数 只 能 获得 实际 用 户 ID 和 有 效用 户 ID 的 当前 值 。 
我 们 不 能 获得 所 保存 的 设置 用 户 ID 的 当前 值 。 
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表 8-7 改变 三 个 用 户 ID 的 不 同方 法 


ID exec 


实际 用 户 ID 
有 效用 户 ID vals 设置 为 程序 文件 的 用 户 ID 设 为 wid 设 为 wid 
保存 的 设置 用 户 ID | 从 有 效用 户 ID 复 制 从 有 效用 户 ID 复制 设 为 wid 不 变 









为 了 说 明 保 存 的 设置 用 户 ID 特 征 的 用 法 ， 先 观察 一 个 使 用 该 特征 的 程序 。 我 们 所 观察 的 是 
man(1) 程 序 ， 它 用 于 显示 联机 手册 页 。man 程 序 可 被 安装 为 设置 用 户 ID 或 设置 组 ip 程 序 ，man 
程序 文件 的 所 有 者 及 他 所 属 的 组 通常 是 为 man 自 身 保 留 的 用 户 或 组 。man 程 序 可 以 被 构造 为 读 
以 及 可 能 重 写 文 件 ， 通 过 配置 文件 (通常 是 /etc/man.config 或 /etc/manpath.config) 
或 者 使 用 命令 行 的 选项 选择 读 、 写 文件 的 位 置 。 
man 程 序 可 能 需要 执行 许多 其 他 命令 ， 以 处 理 包含 需 显示 手册 页 的 文件 。 为 了 防止 被 欺骗 
运行 错误 的 命令 或 重 写 错误 的 文件 ，man 命 令 不 得 不 在 两 种 权限 之 间 切 换 ， 运行 nan 命令 用 户 
的 权限 ， 以 及 拥有 man 可 执行 文件 用 户 的 权限 。 下 面 列 出 了 其 工作 步骤 : 
(1) man 程 序 文件 是 由 名 为 man 的 用 户 拥 有 的 ， 并 且 其 设置 用 户 ID 位 已 设置 。 当 我 们 exec 
此 程序 时 ， 则 关于 用 户 ID 得 到 
实际 用 户 ID = 我 们 的 用 户 ID 
有 效用 户 ID =man 
保存 的 设置 用 户 ID =man 
(2) man 程 序 访 问 需要 的 配置 文件 和 手册 页 。 这 些 文件 是 由 名 为 man 的 用 户 所 拥有 的 ， 因 为 
有 效用 户 ID 是 man ， 所 以 可 以 访问 这 些 文件 。 
(3) 在 man 代 表 我 们 运行 任 一 命令 之 前 ， 它 调用 setuid (getuid())。 因 为 我 们 不 是 超级 
用 户 进程 ， 所 以 这 仅仅 会 改变 有 效用 户 ID。 此 时 得 到 
实际 用 户 ID = 我 们 的 用 户 ID (未 改变 ) 
有 效用 户 ID = 我 们 的 用 户 ID 
保存 的 设置 用 户 ID =man (未 改变 ) 
现在 ，man 进 程 是 以 我 们 的 用 户 ID 作为 其 有 效用 户 ID 而 运行 。 这 就 意味 着 能 访问 的 只 有 我 
们 通常 可 以 访问 的 ， 而 没有 额外 的 权限 。 它 可 以 代表 我 们 安全 地 执行 任 一 过 滤器 程序 (filter), 
(4) 当 执 行 完 过 滤器 操作 后 ，man 调 用 setuiqd (euid)， 其 中 euid 是 用 户 man 的 数值 用 户 ID 
(man 调 用 geteuid， 得 到 用 户 man 的 用 户 ID， 然 后 将 其 保存 起 来 ) 。 因 为 setuid 的 参数 等 干 
保存 的 设置 用 户 ID ， 所 以 这 种 调用 是 许可 的 (这 就 是 为 什么 需要 保存 的 设置 用 户 ID 的 原因 ) 。 
现在 得 到 
实际 用 户 ID = 我 们 的 用 户 ID (未 改变 ) 
有 效用 户 ID =man 
保存 的 设置 用 户 ID =man (未 改变 ) 
(5) 因为 man 程 序 的 有 效用 户 ID 是 man， 所 以 现在 它 可 对 其 文件 进行 操作 。 
以 这 种 方式 使 用 保存 的 设置 用 户 ID ， 于 是 在 进程 的 开始 和 结束 部 分 就 可 以 使 用 由 于 程序 文 
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件 的 设置 用 户 ID 而 得 到 的 额外 特权 。 但 是 ， 进 程 在 其 运行 的 大 部 分 时 间 内 只 具有 普通 的 权限 。 
如 果 进 程 不 能 在 其 结束 时 切换 回 保存 的 设置 用 户 ID， 那 么 就 不 得 不 在 全 部 运行 时 间 都 保持 额外 
的 权限 (这 可 能 会 造成 麻烦 )。 

下 面 来 看 一 看 如 果 在 man 运 行 时 为 我 们 生成 一 个 shell 进 程 ( 先 Eork， 然 后 exec) ， 这 将 发 
生 什 么 ? 因为 实际 用 户 ID 和 有 效用 户 ID 都 是 我 们 的 普通 用 户 ID (上 面 的 第 3 步 )， 所 以 该 shell 没 
有 额外 权限 。 它 不 能 存 取 man 运 行 时 设置 成 man 的 保存 的 设置 用 户 ID ， 因 为 该 shell 所 保存 的 设 
置 用 户 ID 是 由 exec 复 制 有 效用 户 ID 而 得 到 的 。 所 以 在 执行 exec 的 子 进程 中 ， 所 有 三 个 用 户 ID 
都 是 我 们 的 普通 用 户 ID。 

如 果 程 序 文件 是 设置 用 户 ID 为 root ， 那 么 我 们 关于 man 如 何 使 用 setuid 所 做 的 说 明 是 不 
正确 的 。 因 为 以 超级 用 户 特 权 调用 setuid 就 会 设置 所 有 三 个 用 户 ID。 要 使 上 述 实例 按 我 们 所 
说 明 的 进行 工作 ， 只 需 setuid 仅 设置 有 效用 户 ID。 口 


1. setreuid 和 setregid 函 数 
历史 上 ，BSD 支 持 setregid 函 数 ， 其 功能 是 交换 实际 用 户 ID 和 有 效用 户 ID 的 值 。 


#include <unistd.h> 


int setreuid(uid t ruid, uid t euid); 


int setregid(gid t rgid, gid t egid); 


两 个 函数 返回 值 ， 若 成 功 则 返回 9?， 若 出 错 则 返回 -1 


如 车 其 中 任 一 参数 的 值 为 -1， 则 表示 相应 的 ID 应 当 保 持 不 变 。 

相关 规则 很 简单 : 一 个 非特 权 用 户 总 能 交换 实际 用 户 ID 和 有 效用 户 ID。 这 就 允许 一 个 设置 
用 户 ID 程序 转换 成 只 具有 用 户 的 普通 权限 , 以 后 又 可 再 次 转换 回 设置 用 户 ID 所 得 到 的 额外 权限 。 
POSIX.151 和 人 了 保存 的 设置 用 户 ID 特征 后 ， 其 规则 也 相应 加 强 ， 它 允许 一 个 非特 权 用 户 将 其 有 
效用 户 ID 设置 为 保存 的 设置 用 户 ID。 


seteuid 和 setregid 两 个 函数 都 是 Single UNIX Specification 的 XSI 扩 展 。 因 此 ， 预 期 所 有 UNIX 
系统 实现 都 将 提供 对 它们 的 支持 。 

4.3BSD 并 没有 上 面 所 说 的 保 春 的 设置 用 户 ID 特征 。 它 用 setreuiG 和 setregia 来 代替 。 这 就 允许 
一 个 非特 权 用 户 交 换 这 两 个 用 户 ID 的 值 ， 但 是 要 知道 ， 当 使 用 此 特征 的 程序 生成 shell 进 程 时 ， 它 必须 
在 exec 之 前 ， 先 将 实际 用 户 ID 设 置 为 普通 用 户 ID。 如 果 不 这 样 做 的 话 ， 那 么 实际 用 户 ID 就 可 能 是 具有 
特权 的 (由 setreuid 的 交换 操作 造成 )， 然 后 shell 进 程 可 能 会 调用 setreuid 交 换 两 个 用 户 ID 值 并 取得 
更 多 权限 。 作 为 一 个 保护 性 的 解决 这 一 问题 的 编程 措施 ， 程 序 在 子 进 程 调用 exec 之 前 ， 将 子 进程 的 实 
RA PAD Fo Ay CF] P IDA GR ER A PID, 





2. seteuid 和 setegid 函 数 
POIX.1 包 含 了 两 个 函数 seteuid 和 setegid。 它 们 类 似 于 setuid 和 setgid,， 但 只 更 改 
有 效用 户 ID 和 有 效 组 ID 。 


#include <unistd.h> 





int seteuid(uid_t uid); 
int setegid(gid t gid); 
两 个 函数 返回 值 ， 若 成 功 则 返回 0， 若 出 错 则 返回 一 I 
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一 个 非特 权 用 户 可 将 其 有 效用 户 ID 设置 为 其 实际 用 户 ID 或 其 保存 的 设置 用 户 ID。 对 于 一 个 特权 
用 户 ， 则 可 将 有 效用 户 ID 设置 为 wid。( 这 有 别 于 setuid 函 数 ， 它 会 更 改 所 有 三 个 用 户 ID 。) 
图 8-3 给 出 了 本 节 所 述 的 修改 三 个 不 同 用 户 ID 的 各 个 函数 。 
超级 用 户 超级 用 户 超级 用 户 


setreuid(ruid, euid) setuid (uid) Bpeteuid (uid) 
Gig wid 


ruid 


setreuid 















保存 的 设置 
用 户 ID 


非特 权 的 


setreuid 







有 效用 户 ID 





非特 权 的 setuida 非特 权 的 setuia 


mseteuid 或 seteuid 


图 8-3 ”设置 不 同 用 户 ID 的 各 函数 


3. 组 ID 
本 章 中 所 说 明 的 一 切 都 以 类 似 方式 适用 于 各 个 组 ID 。 附 加 组 ID 不 受 setgid、setregia 
或 setegid 函 数 的 影响 。 


8.12 解释 器 文件 


所 有 现今 的 UNIX 系 统 都 支持 解释 器 文件 (interpreter file)。 这 种 文件 是 文本 文件 ， 其 起 始 
行 的 形式 是 : 
#! pathname | optional-argument ] 


感叹 号 和 pathname 之 间 的 空格 是 可 选 的。 最 常见 的 解释 器 文件 以 下 列 行 开始 : 
#!/bin/sh 


Pathname 通 常 是 绝对 路 径 名 ， 对 它 不 进行 什么 特殊 的 处 理 ( 即 不 使 用 PATH 进 行路 径 搜 索 )。 
对 这 种 文件 的 识别 是 由 内 核 作 为 exec 系 统 调用 处 理 的 一 部 分 来 完成 的 。 内 核 使 调用 exec 函 数 
的 进程 实际 执行 的 并 不 是 该 解释 器 文件 ， 而 是 该 解释 器 文件 第 一 行 中 pathname 所 指定 的 文件 。 
一 定 要 将 解释 器 文件 (文本 文件 ， 它 以 #! 开头 ) 和 解释 器 (由 该 解释 器 文件 第 一 行 中 的 
pathname Æ) 区 分 开 来 。 

要 知道 很 多 系统 对 解释 器 文件 的 第 一 行 有 长 度 限 制 。 这 些 限 制 包括 如 、pathname、 可 选 
参数 、 终 止 换行 符 以 及 空格 数 。 


在 FreeBSD 5.2.1 中 ， 该 限制 是 128 字 节 。Mac OS X 10.343 AH5127F%, Linux 2.4.22 支 持 该 
限制 为 127 字 节 ， 而 Solaris 9 设置 的 限制 是 1023 字 节 。 
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让 我 们 观察 一 个 实例 ， 从 中 可 了 解 当 被 执行 的 文件 是 解释 器 文件 时 ， 内 核 如 何 处 理 exec 函 
数 的 参数 及 该 解释 器 文件 第 一 行 的 可 选 参数 。 程 序 清单 8-10 调 用 exec 执 行 一 个 解释 器 文件 。 


程序 清单 8-10 执行 一 个 解释 器 文件 的 程序 


#include "apue.h" 
#include «sys/wait.h» 
int 

main (void) 


pidt pid; 
if ((pid = fork()) < 0) { 
err_sys("fork error") ; 
} else if (pid == 0) { /* child */ 
if (execl("/home/sar/bin/testinterp", 
"testinterp", "myargl", "MY ARG2", (char *)0) « 0) 
err SyS("execl error"); 


if (waitpid(pid, NULL, 0) < 0) /* parent */ 
err_sys ("waitpid error"); 
exit (0); 


} 





下 面 先 显示 要 被 执行 的 该 解释 器 文件 的 内 容 (只 有 一 行 )， 接 着 是 运行 程序 清单 8-10 的 结 
果 。 

$ cat /home/sar/bin/testinterp 

#!/home/sar/bin/echoarg foo 

$ ./a.out 

argv[0]: /home/sar/bin/echoarg 

argv[1]: foo 

argv[2]: /home/sar/bin/testinterp 

argv[3]: myargl 

argv[4]: MY ARG2 
程序 echoarg (解释 器 ) 回 送 每 一 个 命令 行 参数 ( 它 就 是 程序 清单 7-3)。 注 意 ， 当 内 核 exec 该 
解释 器 (/home/sar/bin/echoarg) 时 ， argv【0] 是 该 解释 器 的 pathname，argv[1] 是 解 
释 器 文件 中 的 可 选 参数 ， 其 余 参 数 是 pathname (/home/sar/bin/testinterp), 以 及 程序 
清单 8-10 中 调用 exec1 的 第 二 个 和 第 三 个 参数 (myarg1 和 MY ARG2)。 调 用 execi 时 的 
argv [1] 和 argv[2] 已 右 移 了 两 个 位 置 。 注 意 ， 内 核 取 execi 调 用 中 的 pathname 而 非 第 一 个 参 
数 (testinterp)， 因 为 一 般 而 言 ，pathname 包 含 了 比 第 一 个 参数 更 多 的 信息 。 口 





在 解释 器 pathname 后 可 跟随 可 选 参 数 。 如 果 一 个 解释 器 程序 支持 -f 选 项 ， 那 么 在 pathname 
后 经 常 使 用 的 就 是 -f。 例 如 ， 可 以 以 下 列 方式 执行 awk(1) 程 序 : 


awk -f myfile 


它 告 诉 awk 从 文件 nyfile 中 读 awk 程 序 。 
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在 系统 V 派 生 的 很 多 系统 中 、 常 包含 有 awk 语 言 的 两 个 版 本 。awk 常 常 被 称 为 “ 老 awk”、 它 是 与 V7 
一 起 分 发 的 原始 版 本 。nawk (Hawk) 包含 了 很 多 增强 功能 ， 对 应 于 在 Aho、Kernighan 和 
Weinberger[1988] 中 说 明 的 语言 。 此 新 版 本 提供 了 对 命令 行 参 数 的 存 取 ， 这 是 下 面 的 示例 所 需 的 。 
Solaris 9 提供 了 两 个 版 本 。 

POSIX 1003.2 标 准 现在 是 Single UNIX Specification 中 基本 POSIX.1 规 范 的 一 部 分 。 在 该 标准 中 ， 
awk 程序 是 其 中 的 一 个 实用 程序 。 该 实用 程序 的 基础 也 是 Aho、Kernighan 和 Weinbeger[1988] 中 所 描述 
的 语言 。 

Mac OS X 10.3 中 的 awk 版 本 基于 贝尔 实验 室 版 本 ，Lucent 已 蒋 其 放 在 公共 域 (public domain) 中 。 
FreeBSD 5.2.1 feLinux 2.4.22 提 供 GNU awk ( 称 为 gawk)， 它 链接 至 名 字 awk。gawk 版 本 遵循 POSIX 标 准 ， 
但 也 包括 了 一 些 扩 展 。 因 为 贝尔 实验 室 的 awk 版 本 和 gawk 比 较 疡 ， 所 以 较 之 nawk 或 老 版 本 的 awk 更 受 欢 
迎 。( 贝 尔 实验 室 的 awk 版 本 可 从 http://cm.bell-labs.com/cm/cs/awkbook/index.htmil 取 用 。) 


在 解释 器 文件 中 使 用 -f 选 项 ， 可 以 写成 


#!/bin/awk -f 
(在 此 解释 器 文件 中 后 随 awk 程 序 ) 


例如 ， 程 序 清单 8-11 示 出 了 在 /usr/1local/bin/awkexample 中 的 一 个 解释 路 文件 。 
程序 清单 8-11 作为 解释 器 文件 的 awk 程 序 


#!/bin/awk -f 
BEGIN { 
for (i = 0; i < ARGC; i++) 
printf "ARGV[%d] = %s\n", i, ARGV(i] 
exit 





如 果 路 径 前 缀 之 一 是 /usr/1ocal/pbin， 则 可 以 用 下 列 方式 执行 程序 清单 8-11 (假定 我 们 
已 打开 了 该 文件 的 执行 位 ) : 


$ awkexample filel FILENAME2 f3 


ARGV[0] = awk 
ARGV[1] = filel 
ARGV[2] = FILENAME2 
ARGV[3] = £3 


执行 /bin/awk 时 ， 其 命令 行 参数 是 

/bin/awk -f /usr/local/bin/awkexample filel FILENAME2 f3 
解释 器 文件 的 路 径 名 (/usr/local/bin/awkexample) 被 传送 给 解释 器 。 因 为 不 能 期 望 该 
解释 器 (在 本 例 中 是 /bin/awk) 会 使 用 PATH 变量 定位 该 解释 器 文件 ， 所 以 只 传送 其 路 径 名 中 
的 文件 名 是 不 够 的 ， 所 以 要 将 解释 器 文件 完整 的 路 径 名 传送 给 解释 器 。 当 awk 读 解释 器 文件 时 ， 
因为 # 是 awk 的 注释 字符 ， 所 以 它 会 忽略 第 一 行 。 

可 以 用 下 列 命令 验证 上 述 命令 行 参数 : 


$ /bin/su 成 为 超级 用 户 

Password: 输入 超级 用 户口 令 

# mv /bin/awk /bin/awk.save 保存 原先 的 程序 

* cp /home/sar/bin/echoarg /bin/awk 暂时 替换 它 

# suspend 用 作业 控制 挂 起 超级 用 户 shell 
[1] + Stopped /bin/su 


$ awkexample filel FILENAME2 £3 
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argv [0] : /bin/awk 

argv[1]: -f 

argv[2]: /usr/local/bin/awkexample 
argv[3]: filel 

argv [4]: FILENAME2 


argv[5]: £3 

$ fg 用 作业 控制 恢复 超级 用 户 shell 
/bin/su 

# mv /bin/awk.save /bin/awk 恢复 原先 的 程序 

# exit 终止 超级 用 户 shell 


在 此 示例 中 ， 解 释 器 的 -f 选 项 是 必需 的 。 正 如 前 述 ， 它 告诉 awk 在 什么 地 方 找到 awk 程 序 。 如 
果 从 解释 器 文件 中 删除 -£ 选 项 ， 则 在 试图 运行 该 解释 器 文件 时 ， 通 常 输出 一 条 出 错 消息 。 该 出 
错 消息 的 精确 文本 可 能 有 所 不 同 ， 这 取决 于 解释 器 文件 存放 在 何 处 ， 以 及 其 余 参 数 是 否 表示 现 
有 文件 等 。 因 为 在 这 种 情况 下 命令 行 参数 是 : 


/bin/awk /usr/local/bin/awkexample filel FILENAME2 £3 


于 是 awk 企 图 将 字符 牛 /usr/1local /bin/awkexample 解 释 为 一 个 awk 程 序 。 如 果 不 能 向 解释 
器 传递 至 少 一 个 可 选 参数 〈 在 本 例 中 是 -E) ， 那 么 这 些 解释 器 文件 只 有 对 shell 才 是 有 用 的 。 口 


是 否 一 定 需要 解释 器 文件 呢 ? 那 也 不 完全 如 此 。 但 是 它们 确实 使 用 户 得 到 效率 方面 的 好 处 ， 
其 代价 是 内 核 的 额外 开销 (因为 识别 解释 器 文件 的 是 内 核 )。 由 于 下 述 理由 ， 解 释 器 文件 是 有 
用 的 : 

(1) 有 些 程序 是 用 某 种 语言 编写 的 脚本 ， 解 释 器 文件 可 将 这 一 事实 隐藏 起 来 。 例 如 ， 为 了 
执行 程序 清单 8-11， 只 需 使 用 下 列 命令 行 : 


awkexample optional-arguments 


而 并 不 需要 知道 该 程序 实际 上 是 一 个 awk 脚本 ， 否 则 就 要 以 下 列 方式 执行 该 程序 ， 


awk -f awkexample optional-arguments 


(2) 解释 器 脚本 在 效率 方面 也 提供 了 好 处 。 再 考虑 一 下 前 面 的 例子 。 仍 旧 隐 藏 该 程序 是 一 
个 awk 脚本 的 事实 ， 但 是 将 其 包装 在 一 个 shell 脚 本 中 ， 
awk ‘BEGIN { 
for (i = 0; i < ARGC; i++) 
printf "ARGV[%d] = %s\n", i, ARGV[i] 
ps 
这 种 解决 方案 的 问题 是 要 求 做 更 多 的 工作 。 首 先 ，shell 读 此 命令 ， 然 后 试图 exec1p 此 文 
件 名 。 因 为 shell 脚 本 是 一 个 可 执行 文件 ， 但 却 不 是 机 器 可 执行 的 ， 于 是 返回 一 个 错误 ， 
execlp 就 认为 该 文件 是 一 个 shell 脚 本 〈 它 实际 上 就 是 这 种 文件 )。 然 后 执行 /bin/sh， 并 以 该 
shell 脚 本 的 路 径 名 作为 其 参数 。shell 正 确 地 执行 我 们 的 shell 脚 本 ， 但 是 为 了 运行 awk 程序 ， 它 
会 调用 fork、exec 和 wait。 于 是 ， 用 一 个 shell 脚 本 代替 解释 器 脚本 需要 更 多 的 开销 。 
(3) 解释 器 脚本 使 我 们 可 以 使 用 除 /bin/ sh 以 外 的 其 他 shell 来 编写 shell 脚 本 。 当 execlp 找 
到 一 个 非 机 器 可 执行 的 可 执行 文件 时 ， 它 总 是 调用 /bin/sh 来 解释 执行 该 文件 。 但 是 ， 使 用 解 
释 器 脚本 ， 则 可 编写 成 : 
#!/bin/csh 
(在 解释 器 文件 中 后 接 C shell 脚 本 ) 
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再 一 次 ， 我 们 也 可 将 此 放 在 一 个 /bin/sh 肢 本 中 (然后 由 其 调用 C shel) ， 但 是 要 有 更 多 的 开销 。 
如 果 三 个 shell 和 awk 没 有 用 # 作 为 注释 符 ， 则 上 述 方式 无 效 。 


8.13 systema 


在 程序 中 执行 一 个 命令 字符 串 很 方便 。 例 如 ， 假 定 要 将 时 间 和 日 期 放 到 某 一 个 文件 中 ， 则 
可 使 用 6.10 节 中 说 明 的 函数 实现 这 一 点 。 调 用 time 得 到 当前 日 历时 间 ， 接 着 调用 1ocaltime 
将 日 历时 间 转 换 为 年 、 月 、 日 、 时 、 分 、 秒 、 周 日 形式 ， 然 后 调用 strftime 对 上 面 的 结果 进 
行 格式 化 处 理 ， 最 后 将 结果 写 到 文件 中 。 但 是 用 下 面 的 system 函 数 则 更 容易 做 到 这 一 点。 

system("date > file"); 

ISO C 定 义 了 system 函 数 ， 但 是 其 操作 对 系统 的 依赖 性 很 强 。POSIX.1 包 括 了 system 接 口 ， 
它 扩展 了 ISO C 定 义 ， 以 描述 system 在 POSIX.1 环 境 中 的 运行 行为 。 


#include <stdlib.h> 


int system(const char *cmdstring) ; 


返回 值 : (LF) 


如 果 cmdstring 是 一 个 空 指针 ， 则 仅 当 命 令 处 理 程序 可 用 时 ，system 返 回 非 0 值 ， 这 一 特征 
可 以 确定 在 一 个 给 定 的 操作 系统 上 是 否 支持 system 函 数 。 在 UNIX 中 ，system 总 是 可 用 的 。 

因为 system 在 其 实现 中 调用 了 fork、exec 和 waitpid， 因 此 有 三 种 返回 值 ， 

(1) 如 果 fork 失 败 或 者 waitpiad 返 回 除 EINTR 之 外 的 出 错 ， 则 system 返 回 -1, mE 
errno 中 设置 了 错误 类 型 值 。 

(2) 如 果 exec 失 败 (表示 不 能 执行 shell) ， 则 其 返回 值 如 同 shell 执 行 了 exit(127) 一 样 。 

(3) 否则 所 有 三 个 函数 (fork、exec 和 waitpid) 都 执行 成 功 ， 并 且 system 的 返回 值 是 
shell 的 终止 状态 ， 其 格式 已 在 waitpid 中 说 明 。 





如 果 waitpid 由 一 个 捕捉 到 的 信号 中 断 ， 则 某 些 早期 的 system 实 现 都 返回 错误 类 型 值 EINTR， 但 
是 ， 因 为 没有 可 用 的 清理 策略 能 让 应 用 程序 从 这 种 错误 类 型 中 恢复 ， 所 以 POSIX 后 来 增加 了 下 列 要 求 ; 
在 这 种 情况 下 system 不 返回 一 个 错误 。(10.5 节 中 将 讨论 被 中 断 的 系统 调用 ,) 


程序 清单 8-12 是 system 函 数 的 一 种 实现 。 它 对 信号 没有 进行 处 理 。10.18 节 中 将 修改 此 函 
数 使 其 进行 信号 处 理 。 


程序 清单 8-12 system (没有 信号 处 理 ) 


#include <sys/wait .h> 

#include «errno.h» 

#include <unistd.h> 

int 

system(const char *cmdstring) /* version without signal handling */ 
pid t pid; 
int status; 


if (cmdstring == NULL) 
return(1); /* always a command processor with UNIX */ 


if ((pid - fork()) « o) ( 
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status = -1; /* probably out of processes */ 

} else if (pid == 0) { /* child */ 
execl("/bin/sh", "sh", "-c", cmdstring, (char *)0); 
_exit (127); /* execl error */ 

} else { /* parent */ 


while (waitpid(pid, &status, 0) « 0) { 
if (errno != EINTR) { 
status = -1; /* error other than EINTR from waitpid() */ 
break; 
} 
} 
} 


return(status) ; 


} 


shell 的 -c 选 项 告诉 shell 程 序 取 下 一 个 命令 行 参数 〈 在 这 里 是 cmadstring) 作为 命令 输入 (而 
不 是 从 标准 输入 或 从 一 个 给 定 的 文件 中 读 命 令 ) 。shell 对 以 null 字 符 终止 的 命令 字符 串 进 行 语 法 
分 析 ， 将 它们 分 成 命令 行 参数 。 传 递 给 shell 的 实际 命令 字符 串 可 以 包含 任 一 有 效 的 shell 命 令 。 
例如 ， 可 以 用 < 和 > 重 定向 输入 和 输出 。 

- 如 果 不 使 用 shell 执 行 此 命令 ， 而 是 试图 由 我 们 自己 去 执行 它 ， 那 么 将 相当 困难 。 首 先 ， 我 
们 必须 用 exec1p 而 不 是 exec1 ， 像 shell 那 样 使 用 PATH 变量 。 我 们 必须 将 null 结 尾 的 命令 字符 
串 分 成 各 个 命令 行 参 数 ， 以 便 调用 execlp。 最 后 ， 我 们 也 不 能 使 用 任何 一 个 shell 元 字符 。 

注意 ， 我 们 调用 _exit 而 不 是 exit。 这 是 为 了 防止 任 一 标准 IO 缓冲 区 (这 些 缓冲 区 会 在 
fork 中 由 父 进程 复制 到 子 进程 ) 在 子 进程 中 被 冲洗 。 

用 程序 清单 8-13 对 system 的 这 种 版 本 进行 了 测试 (pr_exit 函 数 定义 在 程序 清单 8-3 中 )。 

程序 清单 8-13 调用 system 函 数 

#include "“apue.h" 

#include <sys/wait .h> 

int 

main (void) 

int status; 


if ((status = system("date")) « 0) 
err sys("system() error"); 
pr exit (status); 


if ((status - system("nosuchcommand")) « 0) 
err Sys("system() error"); 
pr exit(status); 


if ((status = system("who; exit 44")) « 0) 
err Sys("system() error"); 
pr exit (status); 


exit(0); 


) 
运行 程序 清单 8-13 得 到 


$ ./a.out 
Sun Mar 21 18:41:32 EST 2004 
normal termination, exit status = 0 对 于 date 
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Sh: nosuchcommand: command not found 
normal termination, exit status - 127 对 于 无 此 种 命令 


Sar :0 Mar 18 19:45 

sar pts/0 Mar 18 19:45 (:0) 

sar pts/1 Mar 18 19:45 (:0) 

sar pts/2 Mar 18 19:45 (:0) 

sar pts/3 Mar 18 19:45 (:0) 

normal termination, exit status = 44 对 于 exit 


使 用 system 而 不 是 直接 使 用 fork 和 exec 的 优点 是 ; system 进 行 了 所 需 的 各 种 出 错 处 理 ， 
以 及 各 种 信号 处 理 (在 10.18 节 中 的 system 函 数 的 下 一 个 版 本 中 )。 

在 UNIX 的 早期 版 本 中 ， 包 括 SVR3.2 和 4.3BSD， 都 没有 waitpid 函 数 ， 于 是 父 进 程 用 下 列 
形式 的 语句 等 待 子 进程 


while ((lastpid = wait(&status)) !- pid && lastpid != -1) 


如 果 调 用 system 的 进程 在 调用 它 之 前 已 经 生成 它 自己 的 子 进程 ， 那 么 将 引起 问题 。 因 为 上 面 的 
while 语 句 一直 循环 执行 ， 直 到 由 system 产 生 的 子 进程 终止 才 停 止 ， 如 果 不 是 用 pid 标 识 的 任 
一 子 进程 在 pid 子 进程 之 前 终止 ， 则 它们 的 进程 ID 和 终止 状态 都 会 被 while 语 名 丢弃 。 实 际 上 ， 
由 于 wait 不 能 等 待 一 个 指定 的 进程 以 及 其 他 一 些 原 因 ，POSIX.1 Rationale 才 定义 了 waitpid 函 
数 。 如 果 不 提 供 waitpid 函 数 ，popen 和 和 pbclose 函 数 也 会 发 生 同 样 的 问题 ( 见 15.3 节 )。 

设置 用 户 ID 程 序 

如 果 在 一 个 设置 用 户 ID 程序 中 调用 system, 那么 发 生 什么 呢 ? 这 是 一 个 安全 性 方面 的 漏洞 ， 
决 不 应 当 这 样 做 。 程 序 清单 8-14 是 一 个 简单 程序 ， 它 只 是 对 其 命令 行 参数 调用 system 函 数 。 


程序 清单 8-14 用 system 执 行 命令 行 参数 
#include "apue.h" 


int 
main(int argc, char *argv[]l) 


int status; 


if (arge < 2) 
err guit ("command-line argument required"); 


if ((status = system(argv[11)) < 0) 
err sys("system() error"); 

pr exit(status); 

exit (0); 


) 


将 此 程序 编译 成 可 执行 文件 tsys。 

程序 清单 8-15 是 另 一 个 简单 程序 ， 它 打印 其 实际 和 有 效用 户 ID。 
程序 清单 8-15 打印 实际 和 有 效用 户 ID 

#include "apue.h" 


int 
main (void) 
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printf ("real uid = %d, effective uid = %d\n", getuid(), geteuid()); 
exit (0); 





将 此 程序 编译 成 可 执行 文件 printuids。 运 行 这 两 个 程序 ， 得 到 下 列 结果 : 249 
$ tsys printuids 正常 执行 ， 无 特权 

real uid = 205, effective uid = 205 

normal termination, exit status = 0 

$ su 成 为 超级 用 户 

Password: 输入 超级 用 户口 令 

# chown root tsys 更 改 所 有 者 

# chmod u+s tsys 增加 设置 用 户 ID 

# 18 -1 tsys 检验 文件 权限 和 所 有 者 

-rwsrwxr-x 1 root 16361 Mar 16 16:59 tsys 

# exit 退出 超级 用 户 shell 

$ tsys printuids 

real uid = 205, effective uid = 0 哎呀 ! 这 是 一 个 安全 性 漏洞 

normal termination, exit status = 0 

我 们 给 予 tsys 程 序 的 超级 用 户 权限 在 system 中 执行 了 fork 和 exec 之 后 仍 会 保持 下 来 。 

当 /bin/sh 是 bash 版 本 2 时 ， 上 面 的 实例 不 能 工作 ， 其 原因 是 : SHFRAPIDS RHA PIDAL 
配 时 ，bash 将 有 效用 户 ID 设 置 为 实际 用 户 ID。 

如 果 - 一 个 进程 正 以 特殊 的 权限 (设置 用 户 ID 或 设置 组 ID) 运行 ， 它 又 想 生 成 另 一 个 进程 执 
行 另 一 个 程序 ， 则 它 应 当 直 接 使 用 fork 和 exec， 而 且 在 fork 之 后 、exec 之 前 要 改 回 到 普通 
权限 。 设 置 用 户 ID 或 设置 组 ID 程序 决 不 应 调用 system 函 数 。 

这 种 警告 的 一 个 理由 是 : System 调用 shell 对 命令 字符 囊 进 行 语法 分 析 ， 而 shell 使 用 IES 变 量 作为 
其 输入 字段 分 隔 符 。 早 期 的 shell 版 本 在 被 调用 时 不 将 此 变量 恢复 为 普通 字符 集 。 这 就 九 许 一 个 有 恶意 
的 用 户 在 调用 system 之 前 设置 IFS， 造 成 system 执 行 一 个 不 同 的 程序 。 

8.14 进程 会 计 
大 多 数 UNIX 系 统 提供 了 一 个 选项 以 进行 进程 会 计 (process accounting) 处 理 。 启 用 该 选项 
后 ， 每 当 进程 结束 时 内 核 就 写 一 个 会 计 记 录 。 典 型 的 会 计 记 录 包 含 总 量 较 小 的 二 进 制 数据 ， 一 
般 包 括 命令 名 、 所 使 用 的 CPU 时 间 总 量 、 用 户 ID 和 组 ID、 启 动 时 间 等 。 本 节 将 较 详细 地 说 明 这 
会 计 记录 ， 这 样 也 使 我 们 得 到 了 一 个 再 次 观察 进程 的 机 会 ， 以 及 使 用 5.9 节 中 介绍 的 fread 函 数 
的 机 会 。 

任 一 标准 都 没有 对 进程 会 计 进 行 过 说 明 。 于 是 ， 所 有 实现 都 有 令 人 厌烦 的 差别 。 例 如， 关于 D/O 的 
XF, Solaris 9 使 用 的 单位 是 字 节 ，FreeBSD 5.2.1 和 Mac OS X 10.3 使 用 的 单位 是 块 ， 但 又 不 考虑 不 同 
的 块 长 ， 这 使 得 该 计数 值 并 无 实际 效用 。Linux 2.4.22 则 根本 没有 维持 1/O 统 计 。 

每 种 实现 也 都 有 自己 的 一 灾 管 理 命令 去 处 理 这 种 原始 的 会 计数 据 。 例 如 ，Solaris 提 供 了 runacct 
(1m) 和 acctcom(1)，FreeBSD 则 提供 sa(8) 命 令 处 理 并 汇总 原始 会 计数 据 。 

一 个 至 今 没有 说 明 的 函数 (acct) 用 于 启用 和 禁用 进程 会 计 。 唯 一 使 用 这 一 函数 的 是 
accton(8) 命 令 ( 这 是 碰巧 在 几 种 平台 上 都 类 似 的 少数 几 条 命令 中 的 一 条 )。 超 级 用 户 执行 一 个 [250 
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带路 径 名 参数 的 accton 命 令 启 动 会 计 处 理 。 会 计 记 录 写 到 指定 的 文件 中 ， 在 FreeBSD 和 Mac OS 
X 中 ， 该 文件 通常 是 /var /account/acct， 在 Linux 中 ， 该 文件 是 /var/account/ pacct, 
在 Solaris 中 ， 则 是 /var/adm/pacct。 执 行 不 带 任何 参数 的 accton 命 令 可 停止 会 计 处 理 。 

会 计 记录 结构 定义 在 头 文件 <sys /acct .h> 中 ， 其 形式 如 下 : 

typedef u short comp t; /* 3-bit base 8 exponent; 13-bit fraction */ 


struct acct 


{ 


char ac flag; /* flag (see Figure 8.26) */ 

Char ac stat; /* termination status (signal & core flag only) */ 
/* (Solaris only) */ 

uid t ac uid; /* real user ID */ 

gid t ac gid; /* real group ID */ 

dev t ac tty; /* controlling terminal */ 

time t ac btime; /* starting calendar time */ 

comp t ac utime; /* user CPU time (clock ticks) */ 

comp t ac stime; /* system CPU time (clock ticks) */ 

comp t ac etime; /* elapsed time (clock ticks) */ 

comp t ac mem; /* average memory usage */ 

comp t ac io; /* bytes transferred (by read and write) */ 
/* "blocks" on BSD systems */ 

comp t ac rw; /* blocks read or written */ 


/* (not present on BSD systems) */ 

Char | ac comm[8]; /* command name: [8] for Solaris, */ 
/* [10] for Mac OS X, [16] for FreeBSD, and */ 
/* [17] for Linux */ 


}; 
其 中 ，ac_flag 成 员 记 录 了 进程 执行 期 间 的 某 些 事件 。 这 些 事 件 见 表 8-8。 
表 8-8 会 计 记 录 中 的 ac_flag 值 


FreeBSD 5.2.1 Linux 2.4.22 MacOS X10.3 Solaris 9 
















进程 是 由 fork 产 生 的 ， 但 从 未 调用 exec 
进程 使 用 超级 用 户 特权 
进程 使 用 兼容 模式 
进程 转 储 core 
进程 由 信号 杀 死 
扩展 的 会 计 条 上 

会 计 记 录 所 需 的 各 种 数据 (如 CPU 时 间 、 传 输 的 字符 数 ) 都 由 内 核 保存 在 进程 表 中 ， 并 在 
一 个 新 进程 被 创建 时 置 初 值 (例如 调用 fork 之 后 在 子 进程 中 )。 每 次 进程 终止 时 都 会 编写 一 条 
会 计 记 录 。 这 就 意味 着 在 会 计 文件 中 记录 的 顺序 对 应 于 进程 终止 的 顺序 ， 而 不 是 它们 启动 的 顺 
序 。 为 了 确定 启动 顺序 ， 需 要 读 全 部 会 计 文件 ， 并 按 启 动 日 历时 间 进 行 排序 。 这 不 是 一 种 很 完 
善 的 方法 ， 因 为 日 历时 间 的 单位 是 秒 ( 见 1.10 节 )， 在 给 定 的 那 一 秒 钟 可 能 启动 了 多 个 进程 。 而 
墙 上 时 钟 时 间 是 由 时 钟 滴答 (通常 ， 每 秒 滴答 数 在 60 至 128 之 间 ) 给 出 的 。 但 是 我 们 并 不 知道 
进程 的 终止 时 间 ， 所 知道 的 只 是 启动 时 间 和 终止 顺序 。 这 就 意味 着 ， 即 使 墙 上 时 钟 时 间 比 启动 
时 间 要 精确 得 多 ， 但 是 仍 不 能 按照 会 计 文件 中 的 数据 重 构 各 进程 的 精确 启动 顺序 。 

会 计 记录 对 应 于 进程 而 不 是 程序 。 在 fork 之 后 ， 内 核 为 子 进程 初始 化 一 个 记录 ， 而 不 是 
在 一 个 新 程序 被 执行 时 做 这 项 工作 。 虽 然 exec 并 不 创建 一 个 新 的 会 计 记 录 ， 但 改变 了 相应 记 
录 中 的 命令 名 ， 并 且 AFORK 标 志 会 被 清除 。 这 意味 着 ， 如 果 一 个 进程 顺序 执行 了 三 个 程序 









ACOMPAT 
ACORE 
AXSIG 
AEXPND 
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(A exec B， 然 后 B exec C， 最 后 C exit), 
应 于 程序 C， 但 CPU 时 间 是 程序 A、B、C 之 和 。 


但 只 会 写 一 条 会 





为 了 得 到 某 些 会 


Lon, 第 1 个 子 进 各 


sleep (2) 
exit (2) 





sleep (4) 


pec lek ay 


abort () 





[nen 


a 


计数 据 以 便 查看 ， 我 们 按 图 8-4 编 写 了 测试 程序 ( 
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会 计 记录 。 该 记录 中 的 命令 名 对 


见 程 序 清 单 8-16)。 


fo, 第 3 个 子 进程 


po 


sleep (6) 
kill () 





图 8-4 会 计 处 理 实例 的 进程 结构 
该 程序 调用 fork 四 次 。 每 个 子 进 程 做 不 同 的 事情 ， 然 后 终止 。 
程序 清单 8-16 产生 会 计数 据 的 程序 


#include "apue.h" 


int 
main (void) 
{ 
pid t pid; 
if ((pid = fork()) < 0) 
err sSy8("fork error"); 


else if (pid != 0) { /* parent */ 


sleep(2); 
exit(2); 
} 
/* first child */ 
if ((pid = fork()) « 0) 


err_sys("fork error"); 
else if (pid != 0) { 


sleep (4); 
abort () ; 
} 
/* second child */ 
if ((pid = fork()) < 0) 


err sys ("fork error"); 
else if (pid != 0) { 

execl ("/bin/dd", 

exit(7); 


"dd", "ifz/etc/termcap", 


/* third child */ 
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/* terminate with exit status 2 */ 


/* terminate with core dump */ 


"of-/dev/null", NULL); 


/* shouldn't get here */ 
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if ((pid = fork()) < 0) 
err_sys("fork error"); 
else if (pid != 0) { 


sleep (8); 
exit (0); /* normal exit */ 
} 
/* fourth child */ 
sleep (6); 
kill(getpid(), SIGKILL); /* terminate w/signal, no core dump */ 
exit (6); /* shouldn’t get here */ 





253 在 Solaris 上 运行 该 测试 程序 ， 然 后 用 程序 清单 8-17 从 会 计 记 录 中 选择 一 些 字段 并 打印 出 来 。 
程序 清单 8-17 打印 从 系统 会 计 文件 中 选 出 的 字段 


#include "apue.h" 
#include <sys/acct .h> 





#ifdef HAS SA_STAT 
#define FMT "%-*.*s e 
#else 

#define FMT "$-*.*8 e 
#endif 

#ifndef HAS ACORE 
#define ACORE 0 

#endif 

#ifndef HAS AXSIG 
define AXSIG 0 

#endif 


*6ld, chars = &71d, stat = %3u: $c $c $c %c\n" 


*6ld, chars &71d, $c tc &c &cWMn" 


Static unsigned long 
compt2ulong (comp t comptime) /* convert comp t to unsigned long */ 


unsigned long val; 
int exp; 


val = comptime & Oxlfff; /* 13-bit fraction */ 
exp (comptime »» 13) & 7; /* 3-bit exponent (0-7) */ 
while (exp-- > 0) 
val *= 8; 
return(val); 


} 
int 
main(int argc, char *argv[]) 


struct acct acdata; 
FILE *fp; 
if (argc != 2) 
err quit ("usage: pracct filename"); 
if ((fp = fopen(argv[1], "r")) == NULL) 
err_sys ("can't open $s", argv[1]); 
while (fread(&acdata, sizeof(acdata), 1, fp) == 1) { 


printf (FMT, (int) sizeof (acdata.ac_comm), 

(int) sizeof (acdata.ac_comm), acdata.ac comm, 

compt2ulong(acdata.ac etime), compt2ulong(acdata.ac io), 
#ifdef HAS SA STAT 

(unsigned char) acdata.ac stat, 
#endif 

acdata.ac flag & ACORE ? 'D' : ' ', 

acdata.ac flag & AXSIG ? 'X' : ' ', 

acdata.ac flag & AFORK ? 'F' : ' ', 
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acdata.ac_ flag & ASU P M ML hig 


if (ferror(fp)) 
err Sys("read error"); 
exit (0); 





BSD 派 生 的 平台 不 支持 ac_f1lag 成 员 ， 所 以 我 们 在 支持 该 成 员 的 平台 上 定义 了 HAS_SA_ 
STAT 常 量 。 基 于 特征 而 非 平台 定义 的 符号 常量 读 起 来 方便 ， 也 使 我 们 易于 修改 程序 ， 使 用 的 
修改 方法 是 ， 对 编译 命令 增加 附加 的 定义 。 替 代 方 法 可 以 是 使 用 


#if defined(BSD) || defined(MACOS) 


但 是 ， 当 将 应 用 程序 移植 到 其 他 平台 上 时 ， 这 种 方法 会 带 来 很 大 的 不 便 。 

我 们 定义 了 类 似 的 常量 以 判断 该 平台 是 否 支 持 ACORE 和 AXSIG 会 计 标 志 。 我 们 不 能 直接 使 
用 这 两 个 标志 符号 本 身 ， 其 原因 是 : 在 Linux 中 ， 它 们 被 定义 为 enum 值 ， 而 在 #ifdef 表 达 式 
中 不 能 使 用 此 种 类 型 的 值 。 

为 了 进行 测试 ， 执 行 下 列 操作 步 又: 

(1) 成 为 超级 用 户 ， 用 accton 命 令 启 动 会 计 事务 处 理 。 注 意 ， 当 此 命令 结束 时 ， 会 计 事 务 
处 理 已 经 启动 ， 因 此 在 会 计 文件 中 的 第 一 条 记录 应 来 自 这 一 命令 。 

(2) 退出 超级 用 户 shell， 运 行程 序 清单 8-16。 这 会 将 6 个 记录 追加 到 会 计 文 件 中 (超级 用 户 
shell 一 个 ， 父 进程 一 个 ， 四 个 子 进程 各 一 个 )。 

在 第 二 个 子 进程 中 ，exec1 并 不 创建 一 个 新 进程 ， 所 以 对 第 二 个 进程 只 有 一 个 会 计 记 录 。 

(3) 成 为 超级 用 户 ， 停 止 会 计 事务 处 理 。 因 为 在 accton 命 令 终止 时 已 经 停止 处 理会 计 事务 ， 
所 以 不 会 在 会 计 文 件 中 增加 一 个 记录 。 

(4) 运行 程序 清单 8-17， 从 会 计 文 件 中 选 出 字段 并 打印 。 

第 4 步 的 输出 如 下 所 示 。 在 每 一 行 中 都 对 进程 加 了 说 明 ， 以 便 后 面 讨论 。 


accton e = 6, chars = 0, stat = 0: S 

sh e= 2106, chars = 15632, stat = 0: S 

dd e = 8, chars = 273344, stat = 0: 第 二 个 子 进程 
a.out e = 202, chars = 921, stat = 0: 父 进程 
a.out e = 407, chars = 0, stat = 134: F 第 一 个 子 进 程 
a.out e = 600, chars = D stat = 9: F 第 四 个 子 进程 
a.out e = 801, chars = Stat = 0: F 第 三 个 子 进程 


增 上 时 钟 时 间 什 是 以 每 秒 滴答 数 为 单位 测量 的 。 从 表 2-12 可 见 , 本 系统 的 每 秒 滴答 数 是 100。 
例如 ， 在 父 进程 中 的 sleep(2) 对 应 于 202 个 时 钟 滴答 的 墙 上 时 钟 时 间 。 对 于 第 一 个 子 进程 ， 
sleep(4) 变 成 407 个 时 钟 滴答 。 注 意 ， 一 个 进程 休眠 的 时 间 总 量 并 不 精确 。( 第 10 章 将 返回 到 
sleep.) 此 外 ， 调 用 fork 和 exit 也 需要 一 些 时间 。 

注意 ，ac_stat 成 员 并 不 是 进程 的 真正 终止 状态 。 它 只 是 8.6 节 中 讨论 的 终止 状态 的 一 部 
分 。 如 果 进 程 异常 终止 ， 则 此 字 节 包含 的 信息 只 是 核心 标志 位 (一般 是 最 高 位 ) 以 及 信和 号 编号 
(一 般 是 低 7 位 ) 。 如 果 进 程 正常 终止 ， 则 从 会 计 文 件 不 能 得 到 进程 的 退出 (exit) 状态 。 对 于 
第 一 个 进程 ， 此 值 是 128+6。128 是 core 标 志 位 ，6 磁 巧 是 此 系统 信号 STGABRT 的 值 ( 它 是 调用 
abort 产 生 的 )。 第 四 个 子 进程 的 值 是 9， 它 对 应 于 SIGKILL 的 值 。 从 会 计 文件 的 数据 中 不 能 了 
解 到 ， 父 进程 在 退出 时 所 用 的 参数 值 是 2， 三 个 子 进程 退出 时 所 用 的 参数 值 是 0。 

dd 进程 将 文件 /etc/termcap 复 制 到 第 二 个 子 进程 中 ， 该 文件 的 长 度 是 136 663 字 节 。 而 
VO 字符 数 是 此 值 的 两 售 ， 其 原因 是 读 了 136 663 字 节 ， 然 后 又 写 了 136 663 字 节 。 即 使 输出 到 空 
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设备 ， 仍 然 会 统计 IO 字符 数 。 

ac_flag 值 与 我 们 所 预料 的 相同 。 除 调用 exec1l 的 第 二 个 子 进 程 以 外 ， 其 他 子 进程 都 设置 
了 FF 标志 。 父 进程 没有 设置 F 标 志 ， 其 原因 是 交互 式 shell 调 用 fork 生 成 父 进程 ， 然 后 父 进 程 执 
行 a. out 文 件 。 第 一 个 子 进程 调用 abort，abort 产 生 信号 SIGRABRT， 由 此 进行 了 core 转 储 。 
该 进程 的 x 标志 和 D 标 志 都 没有 打开 , 因为 Solaris 不 支持 它们 ， 相 关 信 息 可 从 ac_stat 字 段 导 出 。 
第 四 个 子 进程 也 因 信号 而 终止 ， 但 是 SIGKILL 信 和 号 并 不 产生 core 转 储 ， 它 只 是 终止 该 进程 。 

最 后 要 说 明 的 是 : 第 一 个 子 进程 的 UO 字 符 数 为 0， 但 是 该 进程 产生 了 一 个 core 文 件 。 其 原 
因 是 写 core 文 件 所 需 的 VO 并 不 由 该 进程 负责 。 


8.15 用 户 标识 


任 一 进程 都 可 以 得 到 其 实际 和 有 效用 户 ID 及 组 ID。 但 是 有 时 希望 找到 运行 该 程序 的 用 户 登 
录 名 。 我 们 可 以 调用 getpwuid (getuid()), 但 是 如 果 一 个 用 户 有 多 个 登录 名 ， 这 些 登 录 名 
又 对 应 着 同一 个 用 户 ID， 那 么 又 将 如 何 呢 ?( 一 个 人 在 口令 文件 中 可 以 有 多 个 登录 项 ， 它 们 的 
用 户 ID 相 同 ， 但 登录 shell 则 不 同 。) 系统 通常 记录 用 户 登录 时 使 用 的 名 字 ( 见 6.8 节 )， 用 
getlogin 函 数 可 以 获取 此 登录 名 。 


#include <unistd.h> 


char *getlogin(void) ; 





返回 值 : 若 成 功 则 返回 指向 登录 名 字符 串 的 指针 ， 若 出 错 则 返回 NULL 


如 果 调 用 此 函数 的 进程 没有 连接 到 用 户 登录 时 所 用 的 终端 ， 则 本 函数 会 失败 。 通 常 称 这 些 进程 
为 守护 进程 (daemon) ， 第 13 章 将 讨论 它们 。 

给 出 了 登录 名 ， 就 可 用 getpwnam 在 口令 文件 中 查找 用 户 的 相应 记录 ， 从 而 确定 其 登录 
shell 等 。 


为 了 找到 登录 名 ，UNIX 系 统 在 历史 上 一 直 是 调用 Etynarme 函 数 ( 见 18.9 节 ) ， 然 后 在 utmp 文 件 
( 见 6.8 节 ) 中 查找 匹配 项 。FreeBSPD 和 Mac OS X 将 登录 名 存放 在 与 进程 表 项 相关 联 的 会 话 结构 中 ， 并 
提供 系统 调用 来 获取 和 存储 该 登录 名 。 

ARVREcuscridHKBAERZ, MHKAAMGetlogingK, JeJX X Rmi 538 jn 
getpwuid (getuid()), IEEE Std.1003.1-1988 说 明了 cuseriQ， 但 是 它 以 有 歼 用 户 ID 而 不 是 实际 用 户 
ID 来 调用 。POSIX.1 的 1990 版 本 删除 了 cuserid 孔 数 。 

环境 变量 LOGNRAME 通 常 由 login(1) 以 用 户 的 登录 名 对 其 赋 初 值 ， 并 由 登录 shell 继 承 。 但 是 ， 用 户 
可 以 改变 环境 变量 ， 所 以 不 能 使 用 LOGNRAME 来 确认 用 户 ， 而 应 当 使 用 getlogin 函 数 。 


8.16 进程 时 间 


在 1.10 池 中 说 明了 我 们 可 以 测量 的 三 种 时 间 : 墙 上 时 钟 时 间 、 用 户 CPU 时 间 和 系统 CPU 时 
间 。 任 一 进程 都 可 调用 times 函 数 以 获得 它 自己 及 已 终止 子 进程 的 上 述 值 。 


#include «sys/times.h» 


clock t times(struct tms *buf); 


BEA: 若 成 功 则 返回 流逝 的 墙 上 上 时钟 时 间 (单位 : 时 钟 滴答 数 ) ， 若 出 错 则 返回 -1 
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此 函数 填写 由 bu 指向 的 tms 结 构 ， 该 结构 定义 如 下 : 

struct tms { 
clock_t tms_utime; /* user CPU time */ 
clock_t tms_stime; /* system CPU time */ 
clock t tms cutime; /* user CPU time, terminated children */ 
Clock t tms cstime; /* system CPU time, terminated children */ 

注意 ， 此 结构 没有 包含 墙 上 时 钟 时 间 的 任何 测量 值 。 作 为 替代 ，times 函 数 返 回 墙 上 时 钟 
时 间作 为 其 函数 值 。 此 值 是 相对 于 过 去 的 某 一 时 刻 测量 的 ， 所 以 不 能 用 其 绝对 值 ， 而 必须 使 用 
其 相对 值 。 例 如 ， 调 用 times， 保存 其 返回 值 。 在 以 后 某 个 时 间 再 次 调用 times， 从 新 的 返回 
值 中 减 去 以 前 的 返回 值 ， 此 差 值 就 是 墙 上 时 钟 时 间 。( 一 个 长 期 运行 的 进程 可 能 会 使 墙 上 时 钟 
时 间 溢 出 ， 当 然 这 种 可 能 性 极 小 ， 见 习题 1.6。) 

该 结构 中 两 个 针对 子 进程 的 字段 包含 了 此 进程 用 wait、waitid 或 waitpid 已 等 待 到 的 各 个 
子 进 程 的 值 。 

所 有 由 此 函数 返回 的 clock_t 值 都 用 _SC_CLK_TCK (由 sysconf 函 数 返 回 的 每 秒 时 钟 滴 
答 数 ， 见 2.5.4 节 ) 变换 成 秒 数 。 


大 多 数 实现 都 提供 了 getrusage(2) 函 数 ， 该 函数 返回 GPU 时 间 ， 以 及 指示 资源 使 用 情况 的 另外 14 
个 值 。 该 函数 起 源 于 BSD 系 统 ， 所 以 与 其 他 实现 相 比 ，BSD 派 生 的 实现 支持 的 字段 要 多 一 些 ， 


实 pi 


程序 清单 8-18 将 每 个 命令 行 参数 作为 shell 命 令 串 执行 ， 对 每 个 命令 计时 ， 并 打印 从 tms 结 
构 取得 的 值 。 


程序 清单 8-18 时 间 以 及 执行 所 有 命令 行 参数 


#include "apue.h" 
#include <sys/times.h> 


Static void pr_times(clock_t, struct tms *, struct tms *); 
static void do_cmd(char *); 


int 
main(int argc, char *argv[]) 
{ 

int i; 


setbuf (stdout, NULL); 
for (i = 1; i < argc; i++) 

do emd(argv[i]l); /* once for each command-line arg */ 
exit(0); 


static void 
do cmd(char *cmd) /* execute and time the "cmd" */ 


Struct tms  tmsstart, tmsend; 
clock t start, end; 
int status; 


printf("Xncommand: %s\n", cmd); 


if ((start - times(&tmsstart)) -- -1) /* starting values */ 
err sys("times error"); 
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if ((status = system(cmd)) < 0) /* execute command */ 
err_sys("system() error"); 


if ((end = times (&tmsend)) == -1) /* ending values */ 
err_sys("times error"); 


pr_times(end-start, &tmsstart, &tmsend) ; 
pr_exit (status) ; 


static void 
pr_times(clock_t real, struct tms *tmsstart, struct tms *tmsend) 


{ 


static long clktck = 0; 


if (clktck == 0) /* fetch clock ticks per second first time */ 
if ((clktck = sysconf( SC CLK TCK)) « 0) 


err Sys("sysconf error"); 

printf(" real: %7.2f\n", real / (double) clktck); 
printf(" user: %7.2f\n", 

{tmsend->tms_utime - tmsstart->tms_utime) / (double) clktck); 
printf(" sys: $7.2£\n", 

(tmsend-»tms stime - tmsstart->tms_stime) / (double) clktck); 
printf(" child user: %7.2f\n", 

(tmsend-»tms cutime - tmsstart-»tms cutime) / (double) clktck); 
printf(" child sys: $7.2fMn", 

(tmsend-»tms cstime - tmsstart-»tms cstime) / (double) clktck); 





运行 此 程序 ， 得 到 : 


$ 


-/a.out "sleep 5" "date" 


command: sleep 5 


normal termination, exit status 


real: 5.02 
user: 0.00 
sys: 0.00 
child user: 0.01 
child sys: 0.00 


tt 
o 


command: date 
Mon Mar 22 00:43:58 EST 2004 


real: 0.01 
user: 0.00 
ByB: 0.00 
child user: 0.01 
child sys: 0.00 


normal termination, exit status = 0 


在 这 两 个 实例 中 ， 子 进程 中 显示 的 所 有 CPU 时 间 都 是 执行 shell 和 命令 的 子 进程 所 使 用 的 


8.17 


CPU 时 间 。 Cj 


小 结 


对 于 UNIX 环 境 中 的 高 级 编程 而 言 ， 完 整地 了 解 UNIX 的 进程 控制 是 非常 重要 的 。 其 中 必须 
熟练 掌握 的 只 有 几 个 函数 一 一 fork、exec 族 、_exit、wait 和 waitpid。 很 多 应 用 程序 都 
使 用 这 些 原 语 。fork 原 语 也 给 了 我 们 一 个 了 解 竞争 条 件 的 机 会 。 

本 章 说 明了 system 函 数 和 进程 会 计 ， 这 也 使 我 们 能 进一步 了 解 所 有 这 些 进程 控制 函数 。 
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本 章 还 说 明了 exec 函 数 的 另 一 种 变 体 ， 解释 器 文件 及 其 工作 方式 。 理 解 各 种 不 同 的 用 户 ID 和 
组 ID 实际、 有效 和 保存 的 ) ， 对 编写 安全 的 设置 用 户 ID 程序 是 至 关 重 要 的 。 


在 了 解 进程 和 子 进程 的 基础 上 ， 下 一 章 将 进一步 说 明 一 个 进程 和 其 他 进程 的 关系 一 一 会 话 


和 作业 控制 。 第 10 章 将 说 明 信 号 机 制 并 以 此 结束 对 进程 的 讨论 。 
习题 


8.1 


8.2 


8.3 


8.4 


8.5 
8.6 


8.7 


在 程序 清单 8-2 中 ， 如 果 用 exit 调 用 代替 _exit 调 用 ， 那 么 这 可 能 关闭 标准 输出 ， 并 且 
printf 返 回 -1。 修 改 该 程序 验证 在 你 所 使 用 的 系统 上 是 否 产 生 此 种 结果 。 如 果 并 非 如 此 ， 
你 怎样 处 理 才能 得 到 类 似 结果 呢 ? 

回忆 图 7-3 中 典型 的 存储 空间 布局 。 由 于 对 应 于 每 个 函数 调用 的 栈 帧 通常 存储 在 栈 中 ， 并 
且 由 于 调用 vfork 后 ， 子 进程 运行 在 父 进程 的 地 址 空间 中 ， 如 果 不 是 在 main 函 数 中 而 是 
在 另 一 个 函数 中 调用 vfork， 以 后 子 进程 从 该 函数 返回 时 ， 将 会 发 生 什么 情况 ?编写 一 段 
程序 对 此 进行 验证 ， 并 且 画 图 说 明 发 生 了 什么 。 

当 用 $ ./a.out 执 行程 序 清 单 8-7 一 次 时 ， 其 输出 是 正确 的 。 但 是 若 将 该 程序 按 下 列 方式 
执行 多 次 ， 则 其 输出 不 正确 。 


$ ./a.out ; ./a.out ; ./a.out 
output from parent 

ooutput from parent 

ouctuptut from child 

put from parent 

output from child 

utput from child 


这 将 会 发 生 什么 ? 怎样 才能 更 正 这 种 错误 ? 如 果 使 子 进程 首先 输出 ， 还 会 发 生 此 问题 吗 ? 
在 程序 清单 8-10 中 ,. 调用 exec1l， 指 定 解释 器 文件 的 pathname。 如 果 将 其 改 为 调用 
execlp， 指 定 testinterp 的 filename， 并 且 如 果 目 录 /home/sar/bin 是 路 径 前 级 ， 则 
运行 该 程序 时 ，argv [2] 的 打印 输出 是 什么 ? 

一 个 进程 怎样 才能 获得 其 保存 的 设置 用 户 ID? 

编写 一 段 程序 ， 创 建 一 个 伪 死 进程 ， 然 后 调用 system 执 行 ps( 了 ) 命 令 以 验证 该 进程 是 伪 死 
进程 。 

8.10 节 中 提 及 POSIX.1 要 求 在 调用 exec 时 关闭 打开 的 目录 流 。 按 下 列 方法 对 此 进行 验证 : 
对 根 目 录 调 用 opendir， 查 看 在 你 的 系统 上 实现 的 DIR 结 构 ， 然 后 打印 执行 时 关闭 标志 。 
接着 open 同 一 目录 读 取 并 打印 执行 时 关闭 标志 。 


bbs.theithome.com 


N 
UA 
oO 





bbs.theithome.com 








第 9 章 
进程 关系 





9.1 引言 


在 上 一 童 我 们 已 了 解 到 进程 之 间 具 有 关系 。 首 先 ， 每 个 进程 都 有 一 个 父 进程 初始 的 内 核 
进程 并 无 父 进程 ， 也 可 以 说 其 父 进程 就 是 它 自己 )。 当 子 进程 终止 时 ， 父 进程 得 到 通知 并 能 取 
得 子 进程 的 退出 状态 。 在 8.6 节 说 明 waitpid 函 数 时 ， 我们 也 提 到 了 进程 组 ， 以 及 如 何等 待 进 
程 组 中 的 任意 一 个 进程 终止 。 

本 章 将 更 详细 地 说 明 进程 组 以 及 POSIX.1 引 入 的 会 话 的 概念 。 还 将 介绍 登录 shell (登录 时 
所 调用 的 ) 和 所 有 从 登录 shell 启 动 的 进程 之 间 的 关系 。 

在 说 明 这 些 关 系 时 不 可 能 不 谈 及 信号 ， 而 讨论 信号 时 又 需要 很 多 本 章 介 绍 的 概念 。 如 果 不 
熟悉 UNIX 系 统 信 号 机 制 ， 则 可 能 先 要 浏览 一 下 第 10 章 。 


9.2 终端 登录 


先 说 明 当 我 们 登录 到 UNIX 系 统 时 所 执行 的 各 个 程序 。 在 早期 的 UNIX 系 统 (例如 V7) 中 ， 
用 户 用 哑 终 端 ( 用 硬 连 接连 到 主机 ) 进行 登录 。 终 端 要 么 是 本 地 的 〈 直 接连 接 ) 要 么 是 远程 的 
(通过 调制 解 调 器 连接 ) 。 在 这 两 种 情况 下 ， 登 录 都 经 由 内 核 中 的 终端 设备 驱动 程序 。 例 如 ， 在 
PDP-11 上 常用 的 设备 是 DH-11 和 DZ-11。 因 为 连 到 主机 上 的 终端 设备 数 已 经 确定 ， 所 以 同时 的 
登录 数 也 就 有 了 已 知 的 上 限 。 

随 着 位 映射 图 形 终端 变 成 可 用 ， 开 发 出 了 窗口 系统 ， 它 向 用 户 提 供 了 与 主机 系统 进行 交互 
的 新 方式 。 创 建 “ 终 端 窗口 ”的 应 用 程序 也 被 开发 出 来 ， 它 仿真 了 基于 字符 的 终端 ， 使 得 用 户 
可 以 用 熟悉 的 方式 〈 即 通过 shell 命 令 行 ) 与 主机 交互 。 

现今 ， 某 些 平台 人 允许 用 户 在 登录 后 启动 一 个 窗口 系统 ， 而 另 一 些 平 台 则 自动 为 用 户 启 动 窗 
口 系统 。 在 后 一 种 情况 中 ， 用 户 可 能 仍然 需要 登录 ， 这 取决 于 窗口 系统 是 如 何 配置 的 〈 某 些 窗 
口 系统 可 配置 成 自动 登录 用 户 )。 

我 们 现在 说 明 的 过 程 用 于 经 由 终端 登录 至 UNIX 系 统 。 该 过 程 是 类 似 的 ， 而 与 所 使 用 的 终 
端 无 关 ， 终端 可 以 是 基于 字符 的 终端 、 仿 真 简单 的 基于 字符 终端 的 图 形 终端 ， 或 者 是 运行 窗口 
系统 的 图 形 终端 。 

1. BSD 终 端 登录 

在 过 去 30 年 中 ， 登 录 过 程 并 没有 多 少 改变 。 系 统管 理 员 创 建 通常 名 为 /etc/ttys 的 文件 ， 其 中 ， 
每 个 终端 设备 都 有 一 行 ， 每 一 行 说 明 设备 名 和 传递 给 get ty 程序 的 参数 ， 例 如 ， 参 数 之 一 说 明 
了 终端 的 波 特 率 等 。 当 系统 自 举 时 ， 内 核 创建 进程 ID 为 1 的 进程 ， 也 就 是 init 进 程 。init 进 程 
使 系统 进入 多 用 户 状 态 。init 进 程 读 文件 /etc/ttys， 对 每 一 个 允许 登录 的 终端 设备 ，init 
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调用 一 次 fork， 它 所 生成 的 子 进程 则 执行 (exec) getty 程 序 。 图 9-1 中 显示 了 这 些 进程 。 

图 9-1 中 各 个 进程 的 实际 用 户 ID 和 有 效用 户 ID 都 是 0 ( 即 它们 都 具有 超级 用 户 特 权 )。init 
以 空 环 境 执行 getty 程 序 。 

getty 为 终端 设备 调用 open 函 数 ， 以 读 、 写 方式 将 终端 打开 。 如 果 设 备 是 调制 解 调 器 ， 
则 open 可 能 会 在 设备 驱动 程序 中 滞留 ， 直 到 用 户 拨号 调制 解 调 器 ， 并 且 呼 叫 被 应 答 。 一 且 设 
备 被 打开 ， 则 文件 描述 符 0、1、2 就 被 设置 到 该 设备 。 然 后 getty 输 出 “login:” 之 类 的 信息 ， 
并 等 待 用 户 键入 用 户 名 。 如 果 终 端 支持 多 种 速度 ， 则 getty 可 以 测试 特殊 字符 以 便 适当 地 更 改 
终端 速度 〈 波 特 率 )。 关 于 getty 程 序 以 及 有 关 数 据 文件 (gettytab) 的 细节 ， 请 参阅 UNIX 
系统 手册 。 

当 用 户 键入 了 用 户 名 后 ，getty 的 工作 就 完成 了 。 然 后 它 以 类 似 于 下 面 的 方式 调用 login 
程序 ， 

execle("/bin/login", "login", "-p", username, (char *)0, envp); 
(在 gettytab 文 件 中 可 能 会 有 一 些 选 项 使 其 调用 其 他 程序 ， 但 系统 默认 的 是 1ogin 程 序 ) 。 
init 以 一 个 空 环 境 调 用 getty。getty 以 终端 名 (例如 TERM= foo， 其 中 终端 foo 的 类 型 取 自 
gettytab 文 件 ) 和 在 gettytab 中 说 明 的 环境 字符 电 为 10gin 创 建 一 个 环境 (envp 参 数 )。 
-Pp 标志 通知 login 保 留 传 给 它 的 环境 , 也 可 将 其 他 环境 字符 申 加 到 该 环境 中 , 但 是 不 要 替换 它 。 
图 9-2 显 示 了 1login 刚 被 调用 后 这 些 进程 的 状态 。 

进程 ID1 " 
etc/ttys; 
进程 ID1 ER 人 
M fork ‘Ye, 


> AM EF EP 
每 个 终端 调 

TEREN | 用 一 次 fork 

打开 终端 设备 (文件 描述 
符 0、1、2) ， 读 用 户 
每 个 子 进程 执行 名 ， 初始 环境 设置 


(exec) getty 





图 9-1 init 为 允许 终端 登录 而 调用 的 进程 图 9-2 调用 login 后 的 进程 状态 


因为 最 初 的 init 进 程 具有 超级 用 户 特权 ， 所 以 图 9-2 中 的 所 有 进程 都 有 超级 用 户 特权 。 图 
9-2 中 底部 三 个 进程 的 进程 ID 相同 ， 因 为 进程 ID 不 会 因 执行 exec 而 改变 。 并 且 ， 除 了 最 初 的 
init 进 程 ， 所 有 进程 的 父 进程 卫 均 为 1。 

login 能 执行 多 项 工作 。 因 为 它 得 到 了 用 户 名 ， 所 以 能 调用 getpwnam 取 得 相应 用 户 的 口 
令 文件 登录 项 。 然 后 调用 getpass(3) 以 显示 提示 “Password:”， 接 着 读 用 户 键 和 的 口令 
(自然 ， 禁 止 回 送 用 户 键入 的 口令 )。 它 调用 crypt(3) 将 用 户 键入 的 口令 加 密 ， 并 与 该 用 户 在 阴 
影 口令 文件 中 登录 项 的 pw_passwd 字 段 相 比较 。 如 果 用 户 几 次 键入 的 口令 都 无 效 ， 则 1ogin 
以 参数 1 调用 exit 表 示 登 录 过 程 失败 。 父 进程 (init) 了 解 到 子 进 程 的 终止 情况 后 ， 将 再 次 
调用 fork， 其 后 接着 执行 getty， 对 此 终端 重复 上 述 过 程 。 

这 是 UNIX 系 统 传统 的 用 户 身份 验证 过 程 。 现 代 UNIX 系 统 已 发 展 到 支持 多 个 身份 验证 过 程 。 
例如 ，FreeBSD、Linux、Mac OS Xi 以 及 Solaris 都 支持 被 称 为 PAM (Pluggable Authentication 
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Module， 可 插入 式 身 份 验证 模块 ) 的 更 加 灵活 的 方案 。PAM 人 允许 管 理 员 配 置 使 用 何 种 身份 验证 
方法 来 访问 那些 使 用 PAM 库 编写 成 的 服务 。 

如 果 应 用 程序 需 验 证 一 用 户 是 否 具有 适当 的 权限 去 执行 某 个 服务 ， 那 么 我 们 可 以 将 身份 验 
证 机 制 编写 到 应 用 中 ， 或 者 使 用 PAM 库 来 得 到 等 价 的 功能 。 使 用 PAM 的 优点 是 ,管理 员 可 以 基 
于 本 地 策略 、 针 对 不 同 任务 配置 不 同 的 验证 用 户 身份 的 方法 。 

如 果 用 户 正确 登录 ，1ogin 就 将 执行 如 下 工作 : 

。 将 当前 工作 目录 更 改 为 该 用 户 的 起 始 目录 (chdir), 

。 调 用 chown 改 变 该 终端 的 所 有 权 ， 使 登录 用 户 成 为 它 的 所 有 者 。 

。 将 对 该 终端 设备 的 访问 权限 改变 成 用 户 读 和 写 。 

。 调 用 setgid 及 initgroups 设 置 进程 的 组 ID。 

。 用 login 所 得 到 的 所 有 信息 初始 化 环境 ， 起 始 目录 (HOME), shell (SHELL), APA 

(USER 和 LOGNRAME)， 以 及 一 个 系统 默认 路 径 (PATH), 
。1login 进 程 改变 为 登录 用 户 的 用 户 ID (setuid) 并 调用 该 用 户 的 登录 shell， 如 下 : 


execl("/bin/sh", "-sh", (char *)0); 


argv[0] h %—-+ FH "—" RARE, 表示 该 shell 被 调用 为 登录 shell。shell 可 以 查看 此 字符 ， 
并 相应 地 修改 其 启动 过 程 。 


login 程 序 实际 所 做 的 比 上 面 说 的 要 多 。 它 可 选择 打印 日 期 消息 (message-of-the-day) 文件 ， 
检查 新 邮件 以 及 执行 其 他 一 些 任务 。 但 是 考虑 到 本 书 的 内 容 ， 我 们 主要 关心 上 面 所 说 的 功能 。 

回忆 8.11 节 中 对 setuid 函 数 的 讨论 ， 因 为 setuid 是 由 超级 用 户 调用 的 ， 它 更 改 所 有 三 个 
用 户 ID: 实际 用 户 ID、 有 效用 户 ID 和 保存 的 用 户 ID。1login 在 较 早 时 间 调 用 的 setgid 对 所 有 
三 个 组 ID 也 有 同样 效果 。 

到 此 为 止 ， 登 录用 户 的 登录 shell 开 始 运行 。 其 父 进程 ID 是 init 进 程 ID (进程 ID 1)， 所 以 


当 此 登录 shell 终 止 时 ，init 会 得 到 通知 ( 接 到 进程 ID1 

SIGCHLD 信 号 ) ， 它 会 对 该 终端 重复 全 部 上 述 过 程 。 

将 登录 shell 的 文件 描述 符 0、1 和 2 设置 为 终端 设备 。 

图 9-3 显 示 了 这 种 安排 。 } 通过 getty 和 1ogin 


现在 ， 登 录 shell 读 取 其 启动 文件 (Bourne shell 
和 Korn shell#: .profile; GNU Bourne-again 
shell 是 .bash_profile、.bash_login 或 
-profile; C shell 是 .cshrc 和 .1login)。 这 些 启 
动 文件 通常 会 改变 某 些 环境 变量 ， 加 上 很 多 环境 变 
量 。 例 如 ， 很 多 用 户 设置 他 们 自己 的 PATH， 常 常 提 
示 实 际 终端 类 型 (TERM) 。 当 执行 完 启动 文件 后 ， 
用 户 最 后 得 到 shell 提 示 符 ， 并 能 键入 命令 。 

2. Mac OS X 终 端 登录 

Mac OS X 部 分 基于 FreeBSD， 所 以 其 终端 登录 
进程 与 BSD 登 录 进程 的 工作 步 又 相同 。 但 是 ，Mac OS X 一 开始 提供 的 就 是 图 形 终 端 。 

3. Linux 终 端 登录 

Linux 的 终端 登录 过 程 非常 类 似 于 BSD。 确 实 ，Linux login 命 令 是 从 4.3BSD login 命 令 





图 9-3 为 终端 登录 完成 各 种 设置 后 的 进程 安排 
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派生 而 来 的 。BSD 登 录 过 程 与 Linux 登 录 过 程 的 主要 区 别 在 于 说 明 终端 配置 的 方式 。 

在 Linux 中 ，/etc/inittab 包 含 配置 信息 ， 它 说 明了 init 应 当 为 之 启动 getty 进 程 的 各 终端 
设备 ， 这 类 似 于 系统 V 的 方式 。 依 赖 于 所 使 用 的 getty 的 版 本 ， 终 端的 各 种 特性 要 么 在 命令 行 上 说 
明 〈 如 辣 使 用 agetty 一 样 )， 要 么 在 文件 /etc/gettyefs 中 说 明 (如 同 使 用 mgetty 一 样 )。 

4. Solaris 终 端 登录 

Solaris 支 持 两 种 形式 的 终端 登录 ; (a) getty 方 式 ， 这 与 上 面 对 BSD 所 说 明 的 一 样 ，(b) 
ttymon 登 录 ， 这 是 SVR4 引 入 的 一 种 新 特性 。 通 常 ，getty 用 于 控制 台 ，ttymon 则 用 于 其 他 
终端 登录 。 

ttymon 命 令 是 服务 访问 设施 (Service Access Facility, SAF) 的 一 部 分 。SAF 的 目的 是 用 一 
致 的 方式 对 提供 系统 访问 的 服务 进行 管理 。( 关 于 SAF 的 详细 信息 ， 参 见 Rago[1993] 的 第 6 章 ,) 
按照 本 书 的 宗旨 ， 我 们 只 简单 说 明 从 init 到 登录 shell 之 间 不 同 的 工作 步骤 ， 最 后 结果 则 与 图 9- 
3 中 所 示 相 似 。init 是 sac (service access controller， 服 务 访问 控制 器 ) 的 父 进程 ，sac 调 用 
fork， 然 后 ， 当 系统 进入 多 用 户 状 态 时 ， 其 子 进程 执行 Ltymon 程 序 。ttymon 监 控 列 于 配置 
文件 中 的 所 有 终端 端 日 ， 当 用 户 键入 登录 名 时 ， 它 调用 一 次 fork。 在 此 之 后 ttymon 的 子 进程 
执行 ]ogin， 它 向 用 户 发 出 提示 ， 要 求 输入 口令 。 一 旦 完成 这 一 处 理 ，1ogin 执 行 登录 用 户 的 
登录 shell， 于 是 到 达 了 图 9-3 中 所 示 的 位 置 。 一 个 区 别 是 用 户 登录 shell 的 父 进程 现在 是 ttymon， 
而 在 getty 登 录 中 ， 登 录 shell 的 父 进程 则 是 init。 


9.3 网 络 登 录 


通过 串 行 终端 登录 至 系统 和 经 由 网 络 登 录 至 系统 两 者 之 间 的 主要 (物理 上 的 ) KBE: i 
过 网 络 登录 时 ， 终 端 和 计算 机 之 间 的 连接 不 是 点 对 点 连接 。 在 这 种 情况 下 ，1Login 只 是 一 种 可 
用 的 服务 ， 这 与 其 他 网 络 服务 (例如 FTP 或 SMTP) 的 性 质 相 同 。 

在 上 一 节 所 述 的 终端 登录 中 ，init 知 道 哪 些 终端 设备 可 用 来 进行 登录 ， 并 为 每 个 设备 生 
成 一 个 getty 进 程 。 但 是 ， 在 网 络 登录 情况 下 ， 所 有 登录 都 经 由 内 核 的 网 络 接口 驱动 程序 (如 
以 太 网 驱动 程序 ) ， 事 先 并 不 知道 将 会 有 多 少 这 样 的 登录 。 我 们 不 是 使 一 个 进程 等 待 每 个 可 能 
的 登录 ， 而 是 必须 等 待 一 个 网 络 连接 请 求 的 到 达 。 

为 使 同一 个 软件 既 能 处 理 终 端 1ogin， 又 能 处 理 网 络 1ogin， 系 统 使 用 了 一 -种 称 为 伪 终 端 
(pseudo terminal) 的 软件 驱动 程序 ， 它 仿真 串 行 终端 的 运行 行为 ， 并 将 终端 操作 映射 为 网 络 操 
作 ， 反 之 亦 然 。( 在 第 19 章 ， 我 们 将 详细 说 明 伪 终 端 。) 

1. BSD 网 络 登录 

在 BSD 中 ， 有 一 个 称 为 inetd 的 进程 (有 时 称 之 为 因特网 超级 服务 器 )， 它 等 待 大 多 数 网 
络 连接 。 本 节 将 说 明 BSD 网 络 登 录 中 所 涉及 的 进程 序列 。 关 于 这 些 进 程 的 网 络 程序 设计 方面 的 
细节 ， 请 参阅 Stevens、Fenner 和 Rudoff [2004]。 我 们 在 此 不 详细 说 明 。 

作为 系统 启动 的 一 部 分 ，init 调 用 一 个 shell， 使 其 执行 shell 脚 本 /etc /rc。 由 此 shell 脚 
本 启动 一 个 守护 进程 inetd。 一 旦 此 sheli 脚 本 终止 ，inetd 的 父 进程 就 变 成 jnit。ineta 等 
待 TCP/IP 连 接 请 求 到 达 主 机 ， 而 当 一 个 连接 请 求 到 达 时 ， 它 执行 一 次 fork， 然 后 生成 的 子 进 
程 执 行 适 当 的 程序 。 

我 们 假定 到 达 了 一 个 针对 TELNET 服 务 进程 的 TCP 连 接 请 求 。TELNET 是 使 用 TCP 协 议 的 远 
程 登 录 应 用 程序 。 在 另 一 台 主 机 ( 它 通 过 某 种 形式 的 网 络 与 服务 进程 的 主机 相连 接 ) 上 的 用 户 ， 
或 在 同一 台 主 机 上 的 用 户 启动 TELNET 客 户 进程 ， 由 此 启动 登录 过 程 ， 
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telnet hostname 


该 客户 进程 打开 一 个 到 hostname 主 机 的 TCP 连 接 ， 在 hostname 主 机 上 启动 的 程序 被 称 为 
TELNET 服 务 进程 。 然 后 ， 客 户 进程 和 服务 进程 之 间 使 用 TELNET 应 用 协议 通过 TCP 连 接 交换 
数据 。 所 发 生 的 是 启动 客户 进程 的 用 户 现在 登录 到 了 服务 进程 所 在 的 主机 。( 自 然 ， 用 户 需要 
在 服务 进程 主机 上 有 一 个 有 效 的 账号 ) 。 图 9-4 显 示 了 在 执行 TELNET 服 务 进程 ( 称 为 telnetd) 
时 所 涉及 的 进程 序列 。 

然后 ，telnetd 进 程 打 开 一 个 伪 终 端 设备 ， 并 用 fork 分 成 两 个 进程 。 父 进程 处 理 通 过 网 络 
连接 的 通信 ， 子 进程 则 执行 ogin 程 序 。 父 、 子 进程 通过 伪 终 端 相连 接 。 在 调用 exec 之 前 ， 子 
进程 使 其 文件 描述 符 0、1、2 与 伪 终 端 相连 。 如 果 登 录 正 确 ，1ogin 就 执行 9.2 节 中 所 述 的 同样 步 
QW. 更 改 当 前 工作 目录 为 起 始 目录 ， 设 置 登 录用 户 的 组 ID 和 用 户 ID ， 以 及 登录 用 户 的 初始 环境 。 
然后 1ogin 调 用 exec 将 其 自身 替换 为 登录 用 户 的 登录 shell。 图 9-5 显 示 了 此 时 的 进程 安排 。 


进程 ID1 


进程 ID1 en 
init 
init x 
系统 出 现 多 用 户 jartinetd, telnetd 
i it, /bin/shm - 和 iogin 

来 自 TELNET 客 户 的 fork/exec， 


的 TCP 连 接 请 求 d 执行 shell 脚 本 登录 shell 
inetd /ext/rc 


nii 
!fork Æ BH TELNET 

了 ”了 客户 的 连接 请 

inetd 求 到 达 时 


exec : 
telnetd 终端 用 户 


图 9-4 执行 TELNET 服 务 进程 时 涉及 的 进程 序列 图 9-5 ”为 网 络 登录 完成 各 种 设置 后 的 进程 安排 


很 明显 ， 在 伪 终 端 设备 驱动 程序 和 终端 实际 用 户 之 间 有 很 多 事情 正在 发 生 。 第 19 章 详细 说 
明 伪 终端 时 ， 我 们 会 介绍 与 这 种 安排 相关 的 所 有 进程 。 

需要 理解 的 重点 是 : 当 通过 终端 ( 见 图 9-3) 或 网 络 ( 见 图 9-5) 登录 时 ， 我 们 得 到 一 个 登录 
shell， 其 标准 输入 、 输 出 和 标准 出 错 连接 到 一 个 终端 设备 或 者 伪 终 端 设备 上 。 在 下 一 节 中 我 们 会 
了 解 到 这 一 登录 shell 是 一 个 POSIX.1 会 话 的 开始 ， 而 此 终端 或 伪 终 端 则 是 会 话 的 控制 终端 。 

2. Mac OS X 网 络 登 录 

由 于 Mac OS X 部 分 基于 FreeBSD ， 因 此 经 由 网 络 登 录 至 Mac OS X 系 统 与 BSD 系 统 完全 相同 。 

3. Linux 网 络 登录 

除了 使 用 扩展 的 因特网 服务 守护 进程 xinetd 代 赫 inetaq 进 程 外 ，Linux 网 络 登 录 的 其 他 方 
面 与 BSD 相 同 。xinetad 进 程 对 它 所 启动 的 各 种 服务 的 控制 比 inetd 提 供 的 更 加 精细 。 

4. Solaris 网 络 登 录 

Solaris 中 的 网 络 登 录 方 案 与 BSD 和 Linux 中 的 步 又 几乎 完全 一 样 。 它 同样 使 用 了 类 似 于 BSD 
版 本 的 inetd 服 务 进程 ， 但 是 在 Solaris 中 ，inetd 具 有 一 种 附加 的 能 力 ， 使 其 可 以 在 服务 访问 
设施 框架 下 运行 ,尽管 它 并 没有 配置 成 按 此 种 方式 运行 。 作 为 替代 ，inetd 服 务 进程 由 init 
启动 。 最 后 得 到 的 结果 与 图 9-5 中 一 样 。 














telnetd 服 务 器 和 telnet 
客户 的 网 络 连接 
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9.4 进程 组 


每 个 进程 除了 有 一 个 进程 耳 之 外 ， 还 属于 一 个 进程 组 ， 第 10 章 讨论 信号 时 还 会 涉及 进程 组 。 

进程 组 是 一 个 或 多 个 进程 的 集合 。 通 常 ， 它 们 与 同一 作业 相关 联 (9.8 节 详细 讨论 了 作业 控 
制 )， 可 以 接收 来 自 同一 终端 的 各 种 信号 。 每 个 进程 组 有 一 个 唯一 的 进程 组 DD。 进程 组 ID 类 似 
于 进程 四 一 一 它 是 一 个 正 整数 ， 并 可 存放 在 pi9_t 数 据 类 型 中 。 函 数 getpgrp 返 回调 用 进程 的 
进程 组 ID。 


#include <unistd.h> 


pid t getpgrp (void); 





返回 值 : 调用 进程 的 进程 组 ID 


在 早期 BSD 派 生 的 系统 中 ， 该 函数 的 参数 是 id， 返回 该 进程 的 进程 组 ID Single UNIX 
Specification 将 getpgid 函 数 定义 为 XSI 扩 展 ， 它 模仿 了 此 种 运行 行为 。 


#include <unistd.h> 


pid t getpgid(pid_t pid); 


返回 值 ， 若 成 功 则 返回 进程 组 态 ， 若 出 错 则 返回 一 1 
若 pid 为 0%， 则 返回 调用 进程 的 进程 组 DD， 于 是 ， 


getpgid(0); 
等 价 于 

getpgrp(); 

每 个 进程 组 都 可 以 有 一 个 组 长 进程 。 组 长 进程 的 标识 是 ， 其 进程 组 ID 等 于 其 进程 ID。 

组 长 进程 可 以 创建 一 个 进程 组 ， 创 建 该 组 中 的 进程 ， 然 后 终止 。 只 要 在 某 个 进程 组 中 有 一 
个 进程 存在 ， 则 该 进程 组 就 存在 ， 这 与 其 组 长 进程 是 否 终止 无 关 。 从 进程 组 创建 开始 到 其 中 最 
后 一 个 进程 离开 为 止 的 时 间 区 间 称 为 进程 组 的 生存 期 。 进 程 组 中 的 最 后 一 个 进程 可 以 终止 , 或 
者 转移 到 另 一 个 进程 组 。 

进程 可 以 通过 调用 setpgid 来 加 入 一 个 现 有 的 组 或 者 创建 一 个 新 进程 组 (下 一 节 中 将 说 明 
用 setsid 也 可 以 创建 一 个 新 的 进程 组 )。 








#include <unistd.h> 


int setpgid(pid_t pid, pid t pgid); 


返回 值 ， 若 成 功 则 返回 9， 若 出 错 则 返回 一 1 


setpgid 函 数 将 pid 进 程 的 进程 组 DD 设置 为 pgi4。 如 果 这 两 个 参数 相等 ， 则 由 pid 指 定 的 进 
程 变 成 进程 组 组 长 。 如 果 pid 是 0， 则 使 用 调用 者 的 进程 ID。 另 外 ， 如 果 pgid 是 0， 则 由 piad 指 定 
的 进程 ID 将 用 作 进 程 组 ID。 

一 个 进程 只 能 为 它 自己 或 它 的 子 进程 设置 进程 组 DD。 在 它 的 子 进程 调用 了 exec 函 数 之 一 
后 ， 它 就 不 再 能 改变 该 子 进程 的 进程 组 ID。 

在 大 多 数 作业 控制 shell 中 ， 在 fork 之 后 调用 此 函数 ， 使 父 进程 设置 其 子 进 程 的 进程 组 ID， 
并 且 使 子 进程 设置 其 自己 的 进程 组 DD。 这 两 个 调用 中 有 一 个 是 元 余 的 ， 但 让 你 了 竹 进 程 都 这 么 做 
可 以 保证 ， 在 父 、 子 进程 认为 子 进程 已 进入 了 该 进程 组 时 ， 这 确实 已 经 发 生 了 。 如 果 不 这 样 做 
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的 话 ， 那 么 fork 之 后 ， 由 于 父 、 子 进程 运行 先后 次 序 的 不 确定 ， 会 造成 在 一 段 时 间 内 ( 父 、 子 
进程 中 只 运行 了 其 中 一 个 ) 子 进程 组 员 身 份 的 不 确定 (取决 于 哪个 进程 首先 执行 )， 这 就 产生 
了 竞争 条 件 。 

在 讨论 信号 时 ， 将 说 明 如 何 将 一 个 信号 发 送 给 一 个 进程 (由 其 进程 ID 标 识 ) 或 一 个 进程 组 
(由 进程 组 ID 标 识 )。 同 样 ，8.6 节 的 waitpid 函 数 则 可 用 来 等 待 一 个 进程 或 者 指定 进程 组 中 的 
一 个 进程 终止 。 


9.5 会 话 


会 话 (session) 是 一 个 或 多 个 进程 组 的 集合 。 例 如 ， 可 以 具有 图 9-6 中 所 示 的 安排 。 其 中 ， 
在 一 个 会 话 中 有 三 个 进程 组 。 





RES poses pis Den 
人 qoom EOS SE RS OS een a 
1 Po (01 Er "| 
1 i 3 1 

eee ees M E ERU ETT a i | 
进程 组 i 

| | 

t 1 

GB a J 

进程 组 || 

BEB 


图 9-6 进程 组 和 会 话 中 的 进程 安排 


通常 是 由 shell 的 管道 线 将 几 个 进程 编 成 一 组 的 。 例 如 ， 图 9-6 中 的 安排 可 能 是 由 下 列 形式 的 
shell 命 令 形成 的 : 


procl | proc2 & 
proc3 | proc4 | procs 


进程 调用 setsid 函 数 建 立 一 个 新 会 话 。 


#include <unistd.h> 


pid t setsid(void); 


返回 值 : 车 成 功 则 返回 进程 组 ID ， 若 出 错 则 返回 -1 





如 果 调 用 此 函数 的 进程 不 是 一 个 进程 组 的 组 长 ， 则 此 函数 就 会 创建 一 个 新 会 话 ， 结 果 将 发 生 下 
面 3 件 事 ， 

(1) 该 进程 变 成 新 会 话 首 进程 (session leader), (会话 首 进程 是 创建 该 会 话 的 进程 .) 此 时 ， 
该 进程 是 新 会 话 中 唯一 的 进程 。 

(2) 该 进程 成 为 一 个 新 进程 组 的 组 长 进程 。 新 进程 组 D 是 该 调用 进程 的 进程 ID，。 

(3) 该 进程 没有 控制 终端 (下 一 节 将 讨论 控制 终端 )。 如 果 在 调用 setsid 之 前 该 进程 有 一 
个 控制 终端 ， 那 么 这 种 联系 也 会 被 中 断 。 

如 果 该 调用 进程 已 经 是 一 个 进程 组 的 组 长 ， 则 此 函数 返回 出 错 。 为 了 保证 不 会 发 生 这 种 情 
况 ， 通 常 先 调用 fork， 然 后 使 其 父 进程 终止 ， 而 子 进程 则 继续 。 因 为 子 进 程 继承 了 父 进程 的 
进程 组 ID， 而 其 进程 ID 则 是 新 分 配 的 ， 两 者 不 可 能 相等 ， 所 以 这 就 保证 子 进程 不 会 是 一 个 进程 
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组 的 组 长 。 

Single UNIX Specification 只 包括 “会 话 首 进程 ”， 而 设 有 类 似 于 进程 ID 和 进程 组 ID 的 会 话 
ID。 显 然 ， 会 话 首 进 程 是 具有 唯一 进程 ID 的 单个 进程 ， 所 以 可 以 将 会 话 首 进程 的 进程 ID 视 为 会 
话 ID。 会 话 ID 这 一 概念 是 由 SVR4 引 入 的 。 历 史上 ， 基 于 BSD 的 系统 并 不 支持 这 个 概念 ， 但 后 
来 改 东 易 辐 也 包括 了 它 。getsid 函 数 返 回 会 话 首 进程 的 进程 组 DD。 此 函数 是 Single UNIX 
Specification 的 XSI 扩 展 。 


某 些 实现 〈 例 如 Solaris) 与 Single UNIX Specification 保 持 一 致 ， 在 实践 中 避免 使 用 “会 话 ID” 这 


一 址 语 ， 作 为 蔡 代 ， 将 其 称 为 “会 话 首 进程 的 进程 组 ID”。 会 话 首 进程 总 是 一 个 进程 组 的 组 长 进程 ， 所 
以 两 者 是 等 价 的 。 


#include <unistd.h> 


pid_t getsid(pid_t pid); 





返回 值 : 车 成 功 则 返回 会 话 首 进程 的 进程 组 ID ， 车 出 错 则 返回 -1 


如 若 pid 是 0，getsid 返 回调 用 进程 的 会 话 首 进 程 的 进程 组 DD。 出 于 安全 方面 的 考虑 ， 某 些 实 
现 会 有 如 下 限制 : 如 车 pid 并 不 属于 调用 者 所 在 的 会 话 ， 那 么 调用 者 就 不 能 得 到 该 会 话 首 进程 的 
进程 组 ID。 


9.6 控制 终端 


会 话 和 进程 组 有 一 些 其 他 特性 : 

“一 个 会 话 可 以 有 一 个 控制 终端 (controlling terminal) 。 这 通常 是 登录 到 其 上 的 终端 设备 
(在 终端 登录 情况 下 ) 或 伪 终 端 设备 (在 网 络 登 录 情 况 下 )。 

"建立 与 控制 终端 连接 的 会 话 首 进程 被 称 为 控制 进程 (controlling process), 

“一 个 会 话 中 的 几 个 进程 组 可 被 分 成 一 个 前 台 进程 组 (foreground process group) 以 及 一 个 
或 几 个 后 台 进 程 组 (background process group), 

* 如 果 一 个 会 话 有 一 个 控制 终端 ， 则 它 有 一 个 前 台 进程 组 ， 会 话 中 的 其 他 进程 组 则 为 后 台 
进程 组 。 

“无 论 何 时 键入 终端 的 中 断 键 (常常 是 DELETE 或 Ctrl+C) ， 就 会 将 中 断 信号 发 送 给 前 台 进 
程 组 的 所 有 进程 。 

“ 无论 何 时 键入 终端 的 退出 键 (常常 是 Ctrl+\) ， 就 会 将 退出 信号 发 送 给 前 台 进程 组 中 的 所 
有 进程 。 

“如 果 终 端 接口 检测 到 调制 解 调 器 (或 网 络 ) 已 经 断 开 连接 ， 则 将 挂 断 信号 发 送 给 控制 进 
E (会 话 首 进程 ) 。 

这 些 特性 示 于 图 9-7 中 。 

通常 ， 我 们 不 必 关 心 控制 终端 ， 登 录 时 ， 将 自动 建立 控制 终端 。 
POSIX.1 将 如 何 分 配 一 个 控制 终端 的 机 制 留 由 具体 实现 选择 。19.4 节 中 将 说 明 实 际 步 骤 。 
当 会 话 首 进 程 打 开 第 一 个 尚未 与 一 个 会 话 相关 联 的 终端 设备 时 、 UNIX 系 统 V 派 生 的 系统 将 此 作为 

控制 终端 分 配给 此 会 话 。 这 假定 会 话 首 进 程 在 调用 open 时 没有 指定 O_NOCTTY 标 志 (23.3%), 

当 会 话 首 进程 用 TIOCSCTTY 作 为 reguest 参 数 (第 三 个 参数 是 空 指针 ) 调用 ioct1 时 ， 基 于 BSPD 的 
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AAAA EDERA., 000 OCURRA EE, URGERE ELEC —IIESIR3S GA Fioctl AA 
紧 跟 在 setsid 调 用 之 后 ，setsid 保 证 此 进程 是 一 个 没有 控制 终端 的 会 话 首 进 程 )。 除 了 以 兼容 模式 支 
持 其 他 系统 以 外 ， 基 于 BSD 的 系统 不 使 用 POSIX.1 中 对 cf'en 函 数 所 说 明 的 O_NOCTTY 标 志 。 


Ais 
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后 台 进 程 组 后 台 进程 组 
会 话 首 进程 = 控制 进程 
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E z 
控制 终端 


图 9-7 显示 控制 终端 的 进程 组 和 会 话 

有 了 时 不 管 标准 输入 、 标 准 输出 是 否 被 重 定 向 ， 程序 都 要 与 控制 终端 交互 。 保 证 程序 能 读 写 
控制 终端 的 方法 是 打开 文件 /dev/tty， 在 内 核 中 ， 此 特殊 文件 是 控制 终端 的 同 义 语 。 自 然 ， 
如 果 程 序 没有 控制 终端 ， 则 打开 此 设备 将 失败 。 

经 典 的 示例 是 用 于 读 口令 的 getpass(3) 函 数 (当然 ,终端 回 送 被 关闭 ) 。 这 一 函数 由 
crypt(1) 程 序 调用 ， 而 此 程序 则 可 用 于 管道 中 。 例 如 : 

crypt < salaries | lpr 
将 文件 salaries 解 密 ， 然 后 经 由 管道 将 输出 送 至 打印 假 脱 机 程序 。 因 为 crypt 从 其 标准 输入 读 输 
入 文件 ， 所 以 标准 输入 不 能 用 于 输入 口令 。 但 是 ，crypt 的 一 个 设计 特征 是 每 次 运行 此 程序 时 ， 
都 应 输入 加 窗口 令 ， 这样 也 就 阻止 了 用 户 将 口令 存放 在 文件 中 (这 可 能 是 一 个 安全 性 漏洞 )。 

已 经 知道 有 一 些 方法 可 以 破译 crypt 程 序 使 用 的 密码 。 关 于 加 密 文件 的 详细 情况 请 参见 
Garfinkel 等 [2003]。 


9.7 tcgetpgrp. tcsetpgrpAltcgetsidmA 
需要 有 一 种 方法 来 通知 内 核 哪 一 个 进程 组 是 前 台 进 程 组 ， 这 样 ， 终 端 设备 驱动 程序 就 能 了 
解 将 终端 输入 和 终端 产生 的 信号 送 到 何 处 〈 见 图 9-7)。 
#include <unistd.h> 
pid t tcgetpgrp (int filedes) ; 
返回 值 : 车 成 功 则 和 返回 前 台 进 程 组 的 进程 组 ID， 若 出 错 则 返回 -1 


int tcsetpgrp(int filedes, pid t pgrpid) ; 


返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 -1 
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函数 tcgetpgzp 返 回 前 台 进 程 组 的 进程 组 ID， 该 前 台 进 程 组 与 在 fledes 上 打开 的 终端 相关 联 。 

如 果 进 程 有 一 个 控制 终端 ， 则 该 进程 可 以 调用 csetpgrp 将 前 台 进程 组 ID 设置 为 pgrpid。 
pg8rpid 的 值 应 当 是 在 同一 会 话 中 的 一 个 进程 组 的 ID。filedes 必 须 引 用 该 会 话 的 控制 终端 。 

大 多 数 应 用 程序 并 不 直接 调用 这 两 个 函数 。 它 们 通常 由 作业 控制 shell 调 用 。 

Single UNIX Specification 定 义 了 称 为 Lcgetsid 的 XSI 扩 展 ， 给 出 控制 TTY 的 文件 描述 符 ， 
应 用 程序 就 能 获得 会 话 首 进程 的 进程 组 ID。 


#include <termios.h> 


pid t tcgetsid(int filedes) ; 


返回 值 : 若 成 功 则 返回 会 话 首 进程 的 进程 组 ID ， 若 出 错 则 返回 -1 





需要 管理 控制 终端 的 应 用 程序 可 以 调用 tcgetsid 函 数 识 别 出 控 制 终端 的 会 话 首 进程 的 会 
WD ( 它 等 价 于 会 话 首 进程 的 进程 组 ID ) 。 


9.8 作业 控制 


作业 控制 是 BSD 在 1980 年 前 后 增加 的 一 个 特性 。 它 允许 在 一 个 终端 上 启动 多 个 作业 (进程 
组 )， 它 控制 哪 一 个 作业 可 以 访问 该 终端 ， 以 及 哪些 作业 在 后 台 运行 。 作 业 控 制 要 求 下 面 三 种 
形式 的 支持 : 

(1) 支持 作业 控制 的 shell。 

(2) 内 核 中 的 终端 驱动 程序 必须 支持 作业 控制 。 

(3) 内 核 必须 提供 对 某 些 作业 控制 信号 的 支持 。 


SVR3 提 供 了 一 种 不 同形 式 的 作业 控制 ， 称 为 shell 层 (shell layer) 。 但 是 POSIX.I 选 择 了 BSD 形 式 
的 作业 控制 ， 这 也 是 我 们 在 这 里 所 说 明 的 。 在 POSIX.1 的 早期 版 本 中 ， 作 业 控 制 支持 是 可 选 的 ， 现 在 则 
要 求 所 有 平台 都 支持 它 。 


从 sheli 使 用 作业 控制 功能 角度 讲 ， 用 户 可 以 在 前 台 或 后 台 启 动 一 个 作业 。 一 个 作业 只 是 几 
个 进程 的 集合 ， 通 常 是 一 个 进程 的 管道 线 。 例 如 ; 

vi main.c 
在 前 台 启 动 了 只 有 一 个 进程 组 成 的 一 个 作业 。 命 令 


pr *.c | Iipr & 
make all & 


在 后 台 启 动 了 两 个 作业 。 这 两 个 后 台 作 业 调 用 的 所 有 进程 都 在 后 台 运 行 。 

正如 前 述 ， 我 们 需要 一 个 支持 作业 控制 的 shell 以 使 用 由 作业 控制 提供 的 功能 。 对 于 早期 的 
系统 ，shell 是 否 支持 作业 控制 比较 易于 说 明 。C shell 支 持 作业 控制 ，Bourne shell 则 不 支持 ， 而 
Korn shell 能 否 支持 作业 控制 则 取决 于 主机 是 否 支持 作业 控制 。 但 是 现在 C shell 已 被 移植 到 并 不 
支持 作业 控制 的 系统 上 (例如 系统 V 的 早期 版 本 )， 而 当 用 名 字 jsh 而 不 是 用 sh 调用 SVR4 Bourne 
shell 时 ， 它 支持 作业 控制 。 如 果 主 机 支持 作业 控制 ， 则 Korn Shell 继 续 支 持 作业 控制 。Bourne- 
again shell 也 支持 作业 控制 。 当 各 种 shell 之 间 的 差别 并 不 显著 时 ， 我 们 将 只 是 一 般 性 地 说 明 支持 
作业 控制 的 sheli 和 不 支持 作业 控制 的 shell。 

当 启 动 一 个 后 台 作业 时 ，sheill 赋 予 它 一 个 作业 标识 ， 并 打印 一 个 或 几 个 进程 ID。 下 面 的 肢 
本 显示 了 Kom shell 是 如 何 处 理 这 一 点 的 : 
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$ make all > Make.out & 


[1] 1475 

$ pr *.c | lpr & 

[2] 1490 

$ 键入 回 车 

{2] + Done pr *.c | Ipr & 

{1] + Done make all > Make.out & 


make 是 作业 号 1， 启 动 的 进程 ID 是 1475。 下 一 个 管道 线 是 作业 号 2， 其 第 一 个 进程 的 进程 ID 是 
1490。 当 作业 已 完成 而 且 我 们 键入 回 车 时 ，shell 通 知 我 们 作业 已 经 完成 。 键 入 回 车 是 为 了 让 shell 
打印 其 提示 符 。shell 并 不 在 任何 随意 时 刻 打印 后 台 作 业 的 状态 改变 一 一 它 只 在 打印 其 提示 符 让 用 
户 输 入 新 的 命令 行 之 前 才 这 样 做 。 如 果 不 这 样 处 理 ， 则 当 我 们 正 输入 一 行 时 ， 它 也 可 能 输出 。 

我 们 可 以 键入 一 个 影响 前 台 作 业 的 特殊 字符 一 一 挂 起 键 (一 般 采 用 Ctrl+Z) 与 终端 驱动 程 
序 进行 交互 。 键 入 此 字符 使 终端 驱动 程序 将 信号 SIGTSTP 送 至 前 台 进 程 组 中 的 所 有 进程 ， 后 台 
进程 组 作业 则 不 受 影响 。 实 际 上 有 下 面 三 个 特殊 字符 可 使 终端 驱动 程序 产生 信号 ， 并 将 它们 送 
至 前 台 进 程 组 ， 

。 中 断 字符 (一 般 采 用 DELETE 或 Ctrl+C) 产生 SIGINT。 

。 退 出 字符 (一 般 采 用 Ctrlt\) 产生 SIGQUIT。 

。 挂 起 字符 (一 般 采 用 Ctrl+Z) 产生 SIGTSTP。 
第 18 章 中 将 说 明 可 将 这 三 个 字符 更 改 为 用 户 选 择 的 其 他 字符 ， 以 及 如 何 使 终端 驱动 程序 不 处 理 
这 些 特殊 字符 。 

终端 驱动 程序 必须 处 理 与 作业 控制 有 关 的 另 一 种 情况 。 我 们 可 以 有 一 个 前 台 作 业 和 若干 个 
后 台 作 业 ， 这 些 作业 中 哪 一 个 接收 我 们 在 终端 上 键入 的 字符 呢 ? 只 有 前 台 作业 接收 终端 输入 。 
如 果 后 台 作业 试图 读 终端 ， 那 么 这 并 不 是 一 个 错误 ， 但 是 终端 驱动 程序 将 检测 这 种 情况 ， 并 且 
向 后 台 作业 发 送 一 个 特定 信号 SIGTTIN。 该 信号 通常 会 暂时 停止 此 后 台 作 业 ， 而 shell 则 向 有 关 
用 户 发 出 这 种 情况 的 通知 ， 然 后 用 户 就 可 用 shell 命 令 将 此 作业 转 为 前 台 作 业 运 行 ， 于 是 它 就 可 
读 终 端 。 下 列 操作 过 程 演示 了 这 一 点 : 





$ cat > temp.foo & 在 后 台 启 动 ， 但 将 从 标准 输入 读 
{1] 1681 

$ 键入 回 车 

[1] + Stopped (SIGTTIN) cat > temp.foog& 

$ fg %1 使 1 号 作业 成 为 前 台 作 业 

cat > temp.foo shell 告 诉 我 们 现在 哪 一 个 作业 在 前 台 
hello, world 输入 1 行 

ii 键入 文件 结束 符 

$ cat temp.foo 检查 该 行 已 送 入 文件 


hello, world 


shell 在 后 台 启 动 cat 进 程 ， 但 是 当 cat 试 图 读 其 标准 输入 (控制 终端 ) 时 ， 终 端 驱动 程序 
知道 它 是 个 后 台 作 业 ， 于 是 将 SIGTTIN 信 号 送 至 该 后 台 作 业 。shell 检 测 到 其 子 进程 的 状态 改变 
(回忆 8.6 节 中 对 wait 和 waitpid 的 讨论 )， 并 通知 我 们 该 作业 已 被 停止 。 然 后 ， 我 们 用 shell 的 
fg 命令 将 此 停止 的 作业 送 入 前 台 运 行 (关于 作业 控制 命令 ， 例 如 fg 和 bg 的 详细 情况 ， 以 及 标 
识 不 同 作业 的 各 种 方法 ， 请 参阅 有 关 shell 的 手册 页 )。 这 样 做 可 以 使 shell 将 此 作业 置 入 前 台 进 程 
组 (tcsetpgrp)， 并 将 继续 信号 (SIGCONT) 送 给 该 进程 组 。 因 为 该 作业 现在 位 于 前 台 进 程 
组 中 ， 所 以 它 可 以 读 控制 终端 。 

如 果 后 台 作 业 输 出 到 控制 终端 又 将 发 生 什么 呢 ? 这 是 一 个 我 们 可 以 允许 或 禁止 的 选项 。 通 
常 ， 可 以 用 stty(]) 命 令 改 变 这 一 选项 (第 18 章 将 说 明 在 程序 中 如 何 改变 这 一 选项 )。 下 面 显示 
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了 这 种 工作 方式 : 
$ cat temp.foo & 在 后 台 执行 
{1] 1719 
$ hello, world 提示 符 后 出 现 后 台 作 业 的 输出 

键入 回 车 

{1] + Done cat temp.foo & 
$ stty tostop 禁止 后 台 作 业 输 出 至 控制 终端 
$ cat temp.foo & 在 后 台 再 试 一 次 
[1] 1721 
$ 键入 回 车 ， 发 现 作业 已 停止 
{1] + Stopped (SIGTTOU) Cat temp.foo & 
$ fg %1 在 前 台 恢 复 停止 的 作业 
cat temp.foo shell 告 诉 我 们 现在 哪 一 个 作业 在 前 台 
hello, world 这 是 该 作业 的 输出 


在 用 户 禁止 后 台 作业 写 到 控制 终端 时 ，cat 命 令 将 阻止 该 作业 试图 写 到 其 标准 输出 ， 因 为 
终端 驱动 程序 将 该 写 操作 标识 为 来 自 于 后 台 进 程 ， 于 是 向 该 作业 发 送 SIGTTOU 信 号 。 与 上面 的 
例子 一 样 ， 当 用 户 使 用 shell 的 fg 命令 将 该 作业 带 至 前 台 时 ， 该 作业 继续 执行 直至 完成 。 
图 9-8 总 结 了 前 面 已 说 明 的 作业 控制 的 某 些 功 能 。 穿 过 终端 驱动 程序 框 的 实 线 表 示 : 终端 
276) VO 和 终端 产生 的 信号 总 是 从 前 台 进 程 组 连接 到 实际 终端 。 对 应 于 SIGTTOU 信 号 的 虚线 表示 ， 
后 台 进 程 组 进程 的 输出 是 否 出 现在 终端 是 可 选 的 。 


initminetd 


telnetd 
在 setsid 后 执行 (exec) 
然后 建立 控制 终端 









exec 















tcsetpgrp 来 为 控制 


终端 设置 进程 组 








会 话 
图 9-8 具有 前 台 、 后 台 作 业 以 及 终端 驱动 程序 的 作业 控制 功能 总 结 
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是 否 需要 作业 控制 是 一 个 有 争议 的 话题 。 作 业 控制 是 在 窗口 终端 广泛 得 到 应 用 之 前 设计 和 
实现 的 。 很 多 人 认为 设计 得 好 的 窗口 系统 已 经 免除 了 对 作业 控制 的 需要 。 某 些 人 抱怨 作业 控制 
的 实现 要 求 得 到 内 核 、 终 端 驱动 程序 、shell 以 及 某 些 应 用 程序 的 支持 ， 是 吃力 不 讨好 的 事情 。 
某 些 人 在 窗口 系统 中 使 用 作业 控制 ， 他 们 认为 两 者 都 需要 。 不 管 你 的 意见 如 何 ， 作 业 控 制 都 是 
POSIX.1 要 求 的 功能 。 


9.9 shell 执行 程序 


让 我 们 研究 -- 下 shel 是 如 何 执行 程序 的 ， 以 及 这 与 进程 组 、 控 制 终端 和 会 话 等 概念 的 关系 。 
为 此 ， 再 次 使 用 ps 命令 。 

首先 使 用 不 支持 作业 控制 的 、 在 Solaris 上 运行 的 经 典 Bourne shell。 如 果 执 行 

ps -o pid, ppid, pgid, sid, comm 
则 其 输出 为 


PID PPID PGID SID COMMAND 
949 947 949 949 sh 
1774 949 949 949 ps 


ps 命令 的 父 进程 是 shel， 这 正 是 我 们 所 期 望 的 。shell 和 ps 命令 两 者 位 于 同一 会 话 和 前 台 进 程 组 
(949) 中 。 因 为 我 们 是 用 一 个 不 支持 作业 控制 的 shel 执 行 命令 时 得 到 该 值 的， 所 以 称 949 为 前 
台 进 程 组 。 


灯 些 平台 支持 一 个 选项 ， 它 使 Ps( 有 ) 命 令 打 印 与 会 话 控制 终端 相关 联 的 进程 组 ID。 该 值 显示 在 
TPGID 列 中 。 不 幸 的 是 ，ps 命 令 的 输出 在 各 个 UNIX 有 版 本 之 间 有 所 不 同 。 例 如 ，Solaris 9 不 支持 该 选项 。 
在 FreeBSD 5.2.14eMac OS X 10.3 中 ， 命 令 

ps -o pid,ppid,pgid,sess,tpgid,command 
在 Linux 2.422: p, RA 

ps -o pid,ppid,pgrp, session, tpgid, comm 
都 会 准确 打印 我 们 想 要 的 信息 。 

注意 ， 将 进程 与 终端 进程 组 ID 《TPGID 列 ) 关联 起 来 有 点 用 词 不 当 。 进 程 并 没有 终端 进程 控制 组 
进程 属于 一 个 进程 组 ， 而 进程 组 属于 一 个 会 话 。 会 话 可 能 有 孔 可 能 没有 控制 终端 。 如 果 它 确实 有 一 个 
控制 终端 ， 则 此 终端 设备 知道 其 前 台 进 程 的 进程 组 JD。 这 个 值 可 以 用 tcsetpgrp 吏 数 在 终端 驱动 程序 
中 设置 《 见 图 9-8) 。 前 台 进 程 组 ID 是 终端 的 一 个 属性 ， 而 不 是 进程 的 属性 。 取 自 终端 设备 驱动 程序 的 
该 值 是 ps 在 TPGID 列 中 打印 的 值 。 如 果 Ps 发 现 此 会 话 没有 控制 终端 ， 则 它 在 该 列 打印 一 1。 

如 果 在 后 台 执行 该 命令 : 
ps -o pid, ppid,pgid,sid,comm & 
则 唯一 改变 的 值 是 命令 的 进程 ID。 
PID PPID PGID SID COMMAND 


949 947 949 949 sh 
1812 949 949 949 ps 


因为 这 种 shell 丰 知道 作业 控制 ， 所 以 后 台 作业 没有 构成 另 一 个 进程 组 ， 也 设 有 从 后 台 作业 处 取 
走 控制 终端 。 

现在 看 一 看 Bourne shell 如 何 处 理 管道 线 。 执 行 命令 

ps -o pid,ppid,pgid, sid,comm | catl 


时 其 输出 是 
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PID PPID PGID SID COMMAND 
949 947 949 949 sh 
1823 949 949 949 catl 
1824 1823 949 949 ps 


(程序 cat1 只 是 标准 cat 程 序 的 一 个 副本 ， 但 名 字 不 同 。 本 节 还 将 使 用 cat 的 另 一 个 名 为 cat2 
的 副本 。 在 一 个 管道 线 中 使 用 两 个 cat 副 本 时 ， 不 同 的 名 字 可 使 我 们 将 它们 区 分 开 来 。) EM, 
管道 线 中 的 最 后 一 个 进程 是 shell 的 子 进程 ， 该 管道 线 中 的 第 一 个 进程 则 是 最 后 一 个 进程 的 子 进 
程 。 从 中 可 以 看 出 ，shell fork 一 个 它 自身 的 副本 ， 然 后 此 副本 再 为 管道 线 中 的 每 条 命令 各 
fork 一 个 进程 。 

如 果 在 后 台 执行 此 管道 线 : 

ps -o pid,ppid,pgid,sid,comm | catı & 
则 只 有 进程 ID 改变 了 。 因 为 shell 并 不 处 理 作业 控制 ， 后 台 进 程 的 进程 组 ID 仍 是 949， 如 同 会 话 
的 进程 组 ID 一 样 。 

如 果 一 个 后 台 进 程 试 图 读 其 控制 终端 ， 则 会 发 生 什么 呢 ? 例如 ， 若 执行 : 

cat > temp.foo & 
在 有 作业 控制 时 ， 后 台 作业 被 放 在 后 台 进程 组 中 ， 如 果 后 台 作业 试图 读 控制 终端 ， 则 会 产生 信 
号 SIGTTIN。 在 没有 作业 控制 时 ， 其 处 理 方法 是 : 如 果 该 进程 自己 没有 重 定向 标准 输入 ， 则 
shell 自 动 将 后 台 进程 的 标准 输入 重 定向 到 /dev/null。 读 /dev/nul1 则 产生 一 个 文件 结束 。 
这 就 意味 着 后 台 cat 进 程 立即 读 到 文件 尾 ， 并 正常 结束 。 

上 面 说 明了 对 后 台 进程 通过 其 标准 输入 访问 控制 终端 的 适当 的 处 理 方法 ， 但 是 ， 如 果 一 个 
后 台 进程 打开 /dev/tty 并 且 读 该 控制 终端 ， 又 将 怎样 呢 ? 对 此 问题 的 回答 是 “看 情况 ”。 但 
是 这 很 可 能 不 是 我 们 所 期 望 的 。 例 如 : 

crypt < salaries | lpr & 
就 是 这 样 一 条 管道 线 。 我 们 在 后 台 运行 它 ， 但 是 crypt 程 序 打 开 /dev/tty， 更 改 终端 的 特性 
(禁止 回 送 )， 然 后 读 该 设备 ， 最 后 重 置 该 终端 特性 。 当 执行 这 条 后 台 管 道 线 时 ，crypt 在 终端 
上 打印 提示 符 “Password:”， 但 是 shell 读 取 了 我 们 所 输入 的 加 密 口令 ， 并 试图 执行 以 加 窗口 令 
为 名 称 的 命令 。 我 们 输送 给 shell 的 下 一 行 则 被 crypt 进 程 取 为 口令 行 , 于 是 不 能 正确 对 文件 加 密 ， 
结果 将 一 堆 无 用 信息 送 到 了 打印 机 。 在 这 里 ， 我 们 有 了 两 个 进程 ， 它 们 试图 同时 读 同一 设备 ， 
其 结果 则 依赖 于 系统 。 前 面 说 明 的 作业 控制 以 较 好 的 方式 处 理 一 个 终端 在 多 个 进程 间 的 复 用 。 

返回 到 Boume shell 实 例 ， 如 果 在 一 条 管道 线 中 执行 三 个 进程 ， 我 们 就 可 以 检验 Bourne shell 
使 用 的 进程 控制 方式 : 

ps -o pid, ppid, pgid,sid,comm | cati | cat2 
其 输出 为 


PID PPID PGID SID COMMAND 
949 947 949 949 sh 
1988 949 949 949 cat2 
1989 1988 949 949 ps 
1990 1988 949 949 catı 


如 果 在 你 的 系统 上 ， 输 出 的 命令 名 不 正确 ， 那 也 不 必 为 此 感到 惊慌 。 有 时 你 可 能 会 得 类 似 如 下 的 


输出 : 
PID PPID PGID SID COMMAND 
949 947 949 949 sh 
1831 949 949 949 sh 
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1832 1831 949 949 ps 
1833 1831 949 949 sh 


造成 此 种 结果 的 原因 是 ，ps 进 程 与 shell 产 生 竞 争 条 件 ，shell 创 建 一 个 子 进程 并 由 它 执 行 cat 命 令 。 在 这 
种 情况 下 ， 当 ps 已 经 获得 进程 列表 并 打印 时 ，shell 尚 未 完成 exec 调 用 。 


再 重申 一 遍 ， 该 管道 线 中 的 最 后 一 个 进程 是 shell 的 子 进 程 ， 而 执行 管道 线 中 其 他 命令 的 进 
程 则 是 该 最 后 一 个 进程 的 子 进程 。 图 9-9 显 示 了 所 发 生 的 情况 。 因 为 该 管道 线 中 的 最 后 一 个 进程 
是 登录 shell 的 子 进程 ， 当 该 进程 (cat2) 终止 时 ，shell 得 到 通知 。 


sp 
e l Di 
(0409) | | (1988) 
fos 
SE 
35 sh exec cati 
o. 
e exec 
e s 


图 9-9 Bourne shell 调 用 管道 线 ps 1catl1cat2 时 的 进程 


现在 让 我 们 用 一 个 运行 在 Linux 上 的 作业 控制 shell 来 检验 同一 个 例子 。 这 将 显示 这 些 shell 处 
理 后 台 作 业 的 方法 。 在 本 例 中 将 使 用 Bourne-again shell， 用 其 他 作业 控制 shell 得 到 的 结果 几乎 
完全 一 样 。 

ps -o pid, ppid, pgrp, session, tpgid, comm 
其 输出 为 

PID PPID PGRP SESS TPGID COMMAND 


2837 2818 2837 2837 5796 bash 
5796 2837 5796 2837 5796 ps 


(从 本 例 开始 ， 以 粗 体 显示 前 台 进 程 组 。) 我 们 立即 看 到 了 与 Bourne shell 例 子 的 区 别 。Bourmne- 
again shell 将 前 台 作 业 (ps) 放 入 它 自己 的 进程 组 (5796) 中 。ps 命 令 是 组 长 进程 ， 并 是 该 进 
程 组 中 的 唯一 进程 。 

进一步 讲 ， 此 进程 组 具有 控制 终端 ， 所 以 它 是 前 台 进 程 组 。 我 们 的 登录 shell 在 执行 ps 命令 
时 是 后 台 进 程 组 。 但 需要 注意 的 是 ， 这 两 个 进程 组 2837 和 5796 都 是 同一 会 话 的 成 员 。 事 实 上 ， 
在 本 节 的 各 实例 中 会 话 决 不 会 改变 。 

在 后 台 执 行 此 进程 : 

ps -o pid,ppid,pgrp, session, tpgid,comm & 
其 输出 为 


PID PPID PGRP SESS TPGID COMMAND 
2837 2818 2837 2837 2837 bash 
5797 2837 5797 2837 2837 ps 


再 一 次 ，ps 命 令 被 放 人 它 自 己 的 进程 组 中 ， 但 是 此 时 进程 组 (5797) 不 再 是 前 台 进 程 组 ， 而 是 
一 个 后 台 进 程 组 。TPGID 2837 指 示 前 台 进程 组 是 用 户 的 登录 shell。 
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按 下 列 方式 在 一 个 管道 线 中 执行 两 个 进程 ， 
ps -o pid,ppid,pgrp,session,tpgid,comm | cati 
其 输出 为 


PID PPID PGRP SESS TPGID COMMAND 
2837 2818 2837 2837 5799 bash 
5799 2837 5799 2837 5799 ps 
5800 2837 5799 2837 5799 catl 


两 个 进程 ps 和 cat1 都 在 一 个 新 进程 组 (5799) 中 ， 这 是 一 个 前 台 进 程 组 。 在 本 例 和 类 似 的 
Bourne shell 实 例 之 间 能 看 到 另 一 个 区 别 。Boume shell 首 先 创建 将 执行 管道 线 中 最 后 一 条 命令 的 
进程 ， 而 此 进程 是 第 一 个 进程 的 父 进程 。 在 这 里 ，Bourne-again Shell 是 两 个 进程 的 父 进程 。 但 
是 ， 如 果 在 后 台 执行 此 管道 线 : 

ps -o pid,ppid,pgrp, session,tpgid,comm | cati & 
其 结果 是 类 似 的 ， 但 是 ps 和 cat1 现 在 都 处 于 同一 后 台 进程 组 中 。 


PID PPID PGRP SESS TPGID COMMAND 
2837 2818 2837 2837 2837 bash 
5801 2837 5801 2837 2837 ps 
5802 2837 5801 2837 2837 catı 


注意 ， 如 果 使 用 的 shell 不 同 ， 那 么 它 创建 各 个 进程 的 顺序 也 可 能 不 同 。 
9.10 孤儿 进程 组 


我 们 曾 提 及 ， 一 个 其 父 进程 已 终止 的 进程 称 为 孤儿 进程 (orphan process)， 这 种 进程 由 
init 进 程 “ 收 养 ”。 现 在 我 们 要 说 明 整 个 进程 组 也 可 成 为 “孤儿 ”， 以 及 POSIX.1 如 何 处 理 它 。 

















x 


考虑 一 个 进程 ， 它 fork 了 一 个 子 进程 然后 终止 。 这 在 系统 中 是 经 常 发 生 的 ， 并 无 异常 之 处 ， 
但 是 在 父 进程 终止 时 ， 如 果 该 子 进 程 停止 (用 作业 控制 )， 
则 会 发 生 什么 情况 呢 ? 子 进程 如 何 继续 ， 以 及 子 进 程 是 
否 知道 它 已 经 是 孤儿 进程 ? 图 9-10 显 示 了 这 种 情形 ， 父 进 
程 已 经 fork 了 子 进程 ， 该 子 进 程 停止 ， 父 进程 则 将 退出 。 
产生 这 种 情形 的 程序 示 于 程序 清单 9-1 中 。 下 面 要 说 
明 该 程序 的 某 些 新 特征 。 这 里 ， 假 定 使 用 了 一 个 作业 控 | 
制 shell。 回 忆 前 面 所 述 ，shell 将 前 台 进 程 放 在 它 (Hep ”会 本。 
台 进 程 ) 自己 的 进程 组 〈 本 例 中 是 6099) 中 ，shell 则 留 | es 
在 自己 的 进程 组 (2837) 内 。 子 进程 继承 其 父 进程 à 
(6099) 的 进程 组 。 在 fork 之 后 ; | | | 
。 父 进程 休眠 5 秒 钟 ， 这 是 一 种 让 子 进程 在 父 进 程 终 L---amnzup-- j 
止 之 前 运行 的 一 种 权宜 之 计 。 = 
“ 子 进程 为 挂 断 信 号 (SIGHUP) 建立 信号 处 理 程序 。 图 9-10 将 要 成 为 孤 此 的 进程 组 实例 
这 样 就 能 观察 到 SIGHUP 信 号 是 否 已 发 送 到 子 进 程 。( 第 10 章 将 讨论 信号 处 理 程序 .) 
“ 子 进程 用 kill 函 数 向 其 自身 发 送 停止 信号 (SIGTSTP)。 这 停止 了 子 进程 ， 类 似 于 用 终端 
挂 起 字符 (Ctrl+Z) 停止 一 个 前 台 作业 。 
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。 当 父 进 程 终止 时 ， 该 子 进程 成 为 孤儿 进程 ， 所 以 其 父 进程 卫 成 为 1， 也 就 是 init 进 程 了 。 
*。 现 在 ， 子 进程 成 为 一 个 孤儿 进程 组 的 成 员 。POSIX.1 将 孤儿 进程 组 (orphaned process 
group) 定义 为 ， 该 组 中 每 个 成 员 的 父 进程 要 么 是 该 组 的 一 个 成 员 ， 要 么 不 是 该 组 所 属 会 
话 的 成 员 。 对 孤儿 进程 组 的 另 一 种 描述 如 下 : 一 个 进程 组 不 是 孤儿 进程 组 的 条 件 是 ， 该 
组 中 有 一 个 进程 ， 其 父 进程 在 属于 同一 会 话 的 另 一 个 组 中 。 如 果 进 程 组 不 是 弧 儿 进程 组 ， 
那么 在 属于 同一 会 话 的 另 一 个 组 中 的 父 进程 就 有 机 会 重新 启动 该 组 中 停止 的 进程 。 在 这 
里 ， 进 程 组 中 每 一 个 进程 的 父 进程 例如， 进程 6100 的 父 进程 是 进程 1) 都 属于 另 一 个 会 
话 。 所 以 此 进程 组 是 孤儿 进程 组 。 

* 因为 在 父 进程 终止 后 ， 进 程 组 成 为 孤儿 进程 组 ，POSIX.1 要 求 向 新 的 孤儿 进程 组 中 处 于 停 
止 状态 的 每 一 个 进程 发 送 挂 断 信 号 (SIGHUP)， 接 着 又 向 其 发 送 继续 信号 (SIGCONT), 
“在 处 理 了 挂 断 信 号 后 ， 子 进程 继续 。 对 挂 断 信 号 的 系统 默认 动作 是 终止 该 进程 ， 为 此 必 
须 提 供 一 个 信号 处 理 程序 以 捕 提 该 信号 。 因 此 ， 我 们 期 望 sig_hup 国 数 中 的 printf 会 
在 pr_ids 函 数 中 的 printf 之 前 执行 。 


程序 清单 9-1 创建 一 个 孤 儿 进程 组 


#include "apue.h" 
#include <errno.h> 


static void 
sig_hup(int signo) 


printf ("SIGHUP received, pid = d\n", getpid()); 


static void 
pr_ids(char *name) 


printf ("%s: pid = %d, ppid = %d, pgrp = %d, tpgrp = %d\n", 
name, getpid(), getppid(), getpgrp(), tcgetpgrp (STDIN_FILENO) ) ; 
fflush (stdout) ; 


int 

main (void) 
char C; 
pid_t pid; 


pr_ids ("parent"); 
if ((pid = fork()) < 0) { 
err_sys ("fork error"); 
} else if (pid > 0) {  /* parent */ 


sleep (5); /* sleep to let child stop itself */ 
exit (0); /* then parent exits */ 
} else { /* child */ 
pr_ids ("child"); : 
Signal(SIGHUP, Big hup); /* establish signal handler */ 
kill(getpid(), SIGTSTP); /* stop ourself */ 
pr ids("child"); /* prints only if we're continued */ 
if (read(STDIN FILENO, &c, 1) !- 1) 
printf ("read error from controlling TTY, errno = %d\n", 
errno); 
exit (0); 
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下 面 是 程序 清单 9-1 的 输出 ， 

$ ./a.out 

parent: pid = 6099, ppid = 2837, pgrp = 6099, tpgrp = 6099 
child: pid = 6100, ppid = 6099, pgrp = 6099, tpgrp = 6099 
$ SIGHUP received, pid = 6100 

child: pid = 6100, ppid = 1, pgrp = 6099, tpgrp = 2837 
read error from controlling TTY, errno = 5 


注意 ， 因 为 两 个 进程 即 登 录 shell 和 子 进 程 都 写 向 终端 ， 所 以 shell 提 示 符 和 子 进程 的 输出 一 起 出 
现 。 正 如 我 们 所 期 望 的 那样 ， 子 进程 的 父 进程 ID 变 成 1。 

在 子 进程 中 调用 pr_ids 后 ,程序 试图 读 标准 输入 。 正 如 前 述 ， 当 后 台 进 程 组 试图 读 控制 
终端 时 ， 则 对 该 后 台 进 程 组 产生 STGTTIN。 但 在 这 里 ， 这 是 一 个 孤儿 进程 组 ， 如 果 内 核 用 此 信 
号 停止 它 ， 则 此 进程 组 中 的 进程 就 再 也 不 会 继续 。POSIX.1 规 定 ， 在 这 种 情形 下 reaq 返 回 出 错 ， 
并 将 其 errno 设 置 为 EIO (在 作者 所 用 的 系统 中 其 值 是 5)。 

最 后 ， 要 注意 的 是 父 进程 终止 时 ， 子 进程 被 置 人 后 台 进 程 组 中 ， 因 为 父 进程 是 由 shell 作 为 
前 台 作 业 执 行 的 。 口 

在 19.5 节 的 pty 程 序 中 将 会 看 到 孤儿 进程 组 的 另 一 个 例子 。 

9.11 _ FreeBSD 实现 


上 面 说 明了 进程 、 进 程 组 、 会 话 和 控制 终端 的 各 种 属性 ， 值 得 观察 一 下 所 有 这 些 是 如 何 实 
现 的 。 下 面 简要 说 明 FreeBSD 的 实现 。SVR4 实 现 的 某 些 详细 情况 则 请 参阅 Williams[1989]。 图 
9-11 显 示 了 FreeBSD 使 用 的 各 种 有 关 数 据 结构 。 
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图 9-11 会 话 和 进程 组 的 FreeBSD 实 现 
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下 面 说 明 图 9-11 中 标 出 的 各 个 字段 。 从 session 结 构 开始 。 每 个 会 话 都 分 配 一 个 session 
结构 (例如 ， 每 次 调用 setsid 时 )。 

，s_count 是 该 会 话 中 的 进程 组 数 。 当 此 计数 器 减 至 0 时 ， 则 可 释放 此 结构 。 

，s_leader 是 指向 会 话 首 进 程 proc 结 构 的 指针 。 

，s_ttyvp 是 指向 控制 终端 vnode 结 构 的 指针 。 

。s_ttyp 是 指向 控制 终端 tity 结构 的 指针 。 

。s_sid 是 会 话 ID。 请 记 住 会 话 ID 这 一 概念 并 非 Single UNIX Specification 的 组 成 部 分 。 

在 调用 setsid 时 ， 在 内 核 中 分 配 一 个 新 的 会 话 结 构 。 现 在 s_count 设 置 为 !，s_leader 
设置 为 调用 进程 proc 结 构 的 指针 ，s_sid 设 置 为 进程 ID， 因 为 新 会 话 没 有 控制 终端 ， 所 以 
s_ttyvp 和 s_ttyp 设 置 为 空 指针 。 

接着 说 明 tty 结 构 。 每 个 终端 设备 和 每 个 伪 终 端 设备 均 在 内 核 中 分 配 这 样 一 种 结构 (第 19 
章 将 对 伪 终 端 作 更 多 说 明 )。 

，t_session 指 向 将 此 终端 作为 控制 终端 的 session 结 构 (注意 ，tty 结 构 指向 session 

结构 ，session 结 构 也 指向 tty 结 构 )。 终 端 在 失去 载波 信和 号 时 使 用 此 指针 将 挂 断 信号 送 

给 会 话 首 进程 ( 见 图 9-7)。 

。t_pgrp 指 向 前 台 进 程 组 的 pgrp 结 构 。 终 端 驱动 程序 用 此 字段 将 信号 送 至 前 台 进 程 组 。 

由 输入 特殊 字符 中断、 退出 和 挂 起 ) 而 产生 的 三 个 信号 被 送 至 前 台 进 程 组 。 

*“t_termios 是 包含 所 有 这 些 特殊 字符 以 及 与 该 终端 有 关 信 息 〈 例 如 ， 波 特 率 、 回 送 打开 

或 关闭 等 ) 的 结构 。 第 18 章 将 回 过 头 来 说 明 此 结构 。 

。t_winsize 是 包含 终端 窗口 当前 尺寸 的 winsize 结 构 。 当 终端 窗口 尺寸 改变 了 时， 信号 

SIGWINCH 被 送 至 前 台 进 程 组 。18.12 节 将 说 明 如 何 设置 和 获取 终端 的 当前 窗口 尺寸 。 

注意 ， 为 了 找到 特定 会 话 的 前 台 进 程 组 ， 内 核 不 得 不 从 session 结 构 开 始 ， 然 后 用 
Ss_ttyp 得 到 控制 终端 的 tty 结 构 ， 接 着 用 t_pgrp 得 到 前 台 进程 组 的 pgrp 结 构 。pgrp 结 构 包 
含 一 特定 进程 组 的 信息 。 其 中 各 相关 字段 是 ， 

。pg_id 是 进程 组 ID。 

“pg_session 指 向 此 进程 组 所 属 会 话 的 session 结 构 。 

“p8g_members 是 指向 作为 此 进程 组 成 员 的 proc 结 构 列 表 的 指针 。pzroc 结 构 中 的 p_ 

pglist 结 构 是 一 个 双向 链表 项 ， 它 同时 指向 此 组 中 的 下 一 个 进程 和 前 一 个 进程 ， 依 此 类 

推 ， 直 到 进程 组 中 最 后 一 个 进程 的 proc 结 构 中 遇 到 一 个 空 指针 。 

pzoc 结 构 包 含 一 个 进程 的 所 有 信息 。 

*p_pid 包 含 进程 卫 。 

。p_pptr 是 指向 父 进程 proc 结 构 的 指针 。 

，p_pgrp 指 向 本 进程 所 属 进 程 组 的 pgrp 结 构 的 指针 。 

。 如 前 所 述 ，p_pglist 是 一 个 结构 ， 其 中 包含 两 个 指针 ， 分 别 指向 进程 组 中 的 前 一 个 进 

程 和 下 一 个 进程 。 

最 后 还 有 一 个 vnode 结 构 。 在 打开 控制 终端 设备 时 分 配 此 结构 。 进 程 对 /dev/tty 的 所 有 
引用 都 通过 vnode 结 构 。 图 9-11 中 显示 实际 i 节点 是 v 节 点 的 一 部 分 。 


9.12 小 结 
本 章 说 明了 进程 组 之 间 的 关系 一 一 会 话 ， 它 由 若干 个 进程 组 组 成 。 作 业 控 制 是 当今 很 多 
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UNIX 系 统 所 支持 的 功能 ， 本 章 说 明了 它 是 如 何 由 支持 作业 控制 的 shell 实 现 的 。 在 这 些 进程 关 
系 中 也 涉及 到 了 进程 的 控制 终端 /dev/tty。 

所 有 这 些 进程 的 关系 都 使 用 了 很 多 信号 方面 的 功能 。 下 一 章 将 详细 讨论 UNIX 中 的 信号 
机 制 。 


习题 


9.1 考虑 6.8 节 中 说 明 的 utmp 和 wtmp 文 件 ， 为 什么 注销 记录 是 由 init 进 程 编写 的 ? 对 于 网 络 登 
录 的 处 理 与 此 相同 吗 ? 

92 编写 一 小 段 程序 ， 要 求 调用 foxk 并 使 子 进程 建立 一 个 新 的 会 话 。 验 证 子 进 程 变 成 了 进程 
组 组 长 且 不 再 具有 控制 终端 。 
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10.1 引言 


信号 是 软件 中 断 。 很 多 比较 重要 的 应 用 程序 都 需 处 理 信 号 。 信 号 提供 了 一 种 处 理 异 步 事 件 
的 方法 ， 例 如 ， 终 端 用 户 键入 中 断 键 ， 则 会 通过 信和 号 机 制 停止 一 个 程序 ， 或 及 早 终止 管道 中 的 
T—TRI. 

UNIX 的 早期 版 本 就 已 经 提供 了 信和 号 机 制 ， 但 是 这 些 系统 〈 例 如 V7) 所 提供 的 信号 模型 并 
不 可 靠 。 信 号 可 能 丢失 ， 而 且 在 执行 临界 区 代码 时 ， 进 程 很 难关 闭 所 选择 的 信号 。4.3BSD 和 
SVR3 对 信号 模型 都 做 了 更 改 ， 增 加 了 可 靠 信号 机 制 。 但 是 Berkeley 和 AT&T 所 做 的 更 改 之 间 并 
不 兼容 。 幸 运 的 是 POSIX.1 对 可 靠 信号 例 程 进行 了 标准 化 ， 这 正 是 本 章 所 要 说 明 的 。 

本 章 先 对 信号 机 制 进行 综述 ， 并 说 明 每 种 信号 的 一 般 用 法 。 然 后 分 析 早 期 实现 的 问题 。 在 
分 析 存在 的 问题 之 后 再 说 明 解决 这 些 问 题 的 方法 ， 这 种 安排 有 助 于 加 深 对 改进 机 制 的 理解 。 本 
章 也 包含 了 很 多 并 非 完全 正确 的 实例 ， 这 样 做 的 目的 是 为 了 对 其 不 足 之 处 进行 讨论 。 


10.2 信号 概念 


首先 ， 每 个 信号 都 有 一 个 名 字 。 这 些 名 字 都 以 三 个 字符 SIG 开 头 。 例 如 ，SIGRABRT 是 天 折 
信号 ， 当 进程 调用 abort 函 数 时 产生 这 种 信号 。SIGALRM 是 闹钟 信号 ， 当 由 alarm 函 数 设 置 的 
计时 器 超时 后 产生 此 信号 。V7 有 15 种 不 同 的 信号 ，SVR4 和 4.4BSD 均 有 31 种 不 同 的 信和 号。 
FreeBSD 5.2.1, Mac OS X 10.3 以 及 Linux 2.4.22 支 持 31 种 不 同 的 入 号， 而 Solaris 9 则 支持 38 种 不 
同 的 信号 。 另 外 ，Linux 和 Solaris 都 支持 应 用 程序 额外 定义 的 信号 ， 将 其 作为 实时 扩展 (ABA 
包括 POSIX 实 时 扩展 ， 有 关 信 息 请 参阅 Gallmeister[1995])。 

在 头 文件 <signal .h> 中 ， 这 些 信号 都 被 定义 为 正 整数 (信号 编号 )。 


实际 上 ， 实 现 将 各 信号 定义 在 另 一 个 头 文件 中 ,但 是 该 头 文件 又 包括 在 <signal.h> 中 。 内 核 包 
括 对 用 户 级 应 用 程序 有 总 义 的 头 文件 ， 这 被 认为 是 一 种 糟 存 的 形式 ， 所 以 如 若 应 用 程序 和 内 核 两 者 都 
需 使 用 同一 定义 ， 那 么 就 将 有 关 信 息 放 置 在 内 核 头 文件 中 ， 然 后 用 户 级 头 文件 再 包括 该 内 核 头 文件 。 
于 是 ，FreeBSD 5.2.1 和 Mac OS X 10.3 将 信号 定义 在 <sys/signal.h> 中 ，Linux 2.4.22 将 信号 定义 在 
<bits/signum.h> 中 ，Solaris 93] #44 3 X 3 f «sys/iso/sianal iso.h»'j 


N 
Co 
Ks) 


不 存在 编号 为 0 的 信号 。 在 10.9 节 中 将 会 看 到 ，ki11 国 数 对 信号 编号 0O 有 特殊 的 应 用 。 
POSIX.1 将 此 种 信号 编号 值 称 为 空 信号 。 

很 多 条 件 可 以 产生 信和 号 : 

“。 当 用 户 按 某 些 终端 键 时 ， 引 发 终端 产生 的 信号 。 在 终端 上 按 DELETE 键 (或 者 很 多 系统 
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中 的 Ctrl+C 键 ) 通常 产生 中 断 信 号 (SIGINT)。 这 是 停止 一 个 已 失去 控制 的 程序 的 方法 。 
(第 18 音 将 说 明 此 信号 可 被 映射 为 终端 上 的 任 一 字符 。) 

。 硬 件 异常 产生 信忠， 除数 为 0、 无 效 的 内 存 引 用 等 等 。 这 些 条 件 通 常 由 硬件 检测 到 ， 并 将 

其 通知 内 核 。 然 后 内 核 为 该 条 件 发 生 时 正在 运行 的 进程 产生 适当 的 信号 。 例 如， 对 执行 

一 个 无 效 内 存 引 用 的 进程 产生 SIGSEGV 信 号 。 

。 进 程 调 用 ki11(2) 函 数 可 将 信号 发 送 给 另 一 个 进程 或 进程 组 。 自 然 ， 对 此 有 所 限制 ， 接 收 信 

号 进程 和 发 送信 号 进程 的 所 有 者 必须 相同 ， 或 者 发 送信 号 进程 的 所 有 者 必须 是 超级 用 户 。 

* 用 户 可 用 ki11(D 命 令 将 信号 发 送 给 其 他 进程 。 此 命令 只 是 ki11 函 数 的 接口 。 常 用 此 命 

令 终止 一 个 失控 的 后 台 进 程 。 

。 当 检测 到 某 种 软件 条 件 已 经 发 生 ， 并 应 将 其 通知 有 关 进 程 时 也 产生 信号 。 这 里 指 的 不 是 

硬件 产生 的 条 件 (如 除 以 0)， 而 是 软件 条 件 。 例 如 SIGURG (在 网 络 连接 上 传 来 带 外 数据 

时 产生 )、SIGPIPE (在 管道 的 读 进 程 已 终止 后 ， 一 个 进程 写 此 管道 时 产生 ) ， 以 及 

SIGALRM (进程 所 设置 的 闹钟 时 钟 超时 时 产生 )。 

信号 是 异步 事件 的 经 典 实 例 。 产 生 信号 的 事件 对 进程 而 言 是 随机 出 现 的 。 进 程 不 能 简单 地 
测试 一 个 变量 (例如 errno) 来 判别 是 否 出 现 了 一 个 信和 号， 而 是 必须 告诉 内 核 “ 在 此 信号 出 现 
时 ， 请 执行 下 列 操作 ”。 

可 以 要 求 内 核 在 某 个 信号 出 现时 按照 下 列 三 种 方式 之 一 进行 处 理 ， 我 们 称 之 为 信号 的 处 理 
或 者 与 信号 相关 的 动作 。 

(1) 忽略 此 信号 。 大 多 数 信 号 都 可 使 用 这 种 方式 进行 处 理 ， 但 有 两 种 信号 却 决 不 能 被 忽略 。 
它们 是 STGKILL 和 SIGSTOP。 这 两 种 信号 不 能 被 忽略 的 原因 是 ， 它 们 向 超级 用 户 提供 了 使 进 
程 终止 或 停止 的 可 靠 方法 。 另 外 ， 如 果 忽 略 某 些 由 硬件 异常 产生 的 信和 号 (例如 非法 内 存 引 用 或 
除 以 0) ， 则 进程 的 运行 行为 是 未 定义 的 。 

(2) 捕捉 信号 。 为 了 做 到 这 一 点 ， 要 通知 内 核 在 某 种 信号 发 生 时 调用 一 个 用 户 函 数 。 在 用 
户 函 数 中 ， 可 执行 用 户 希 望 对 这 种 事件 进行 的 处 理 。 例 如 ， 若 正在 运行 一 个 命令 解释 器 ， 它 将 
用 户 的 输入 解释 为 命令 并 执行 之 ， 当 用 户 用 键盘 产生 中 断 信 号 时 ， 很 可 能 希望 该 命令 解释 器 返 
回 到 主 循环 ， 终 止 正在 为 该 用 户 执行 的 命令 。 如 果 捕 捉 到 SIGCHLD 信 号， 则 表示 一 个 子 进程 已 
经 终止 ,所 以 此 信号 的 捕捉 函数 可 以 调用 waitpid 以 取得 该 子 进程 的 进程 ID 以 及 它 的 终止 状态 。 
又 例如 ， 如 果 进 程 创建 了 临时 文件 ， 那 么 可 能 要 为 STGTERM 信 号 编写 一 个 信号 捕捉 函数 以 清除 
临时 文件 (SIGTERM 是 终止 信号 ，ki11 命 令 传 送 的 系统 默认 信号 是 终止 信号 )。 注 意 ， 不 能 捕 
提 SIGKILL 和 SIGSTOP 信 号。 

(3) 执行 系统 默认 动作 。 表 10-1 给 出 了 针对 每 一 种 信号 的 系统 默认 动作 。 注 意 ， 针 对 大 多 数 
信号 的 系统 默认 动作 是 终止 进程 。 

表 10-1 列 出 了 所 有 信和 号 的 名 字 ， 说 明了 哪些 系统 支持 此 信和 号 以 及 针对 这 些 信和 号 的 系统 默认 
动作 。 在 SUS 列 中 ,。 表 示 此 种 信号 被 定义 为 基本 POSIX.1 规 范 部 分 ,“XSI” 表 示 该 信号 定义 为 
该 基本 规范 的 XSI 扩 展 。 

在 “默认 动作 ” 列 中 ,“ 终 止 +core” 表 示 在 进程 当前 工作 目录 和 的 core 文 件 中 复制 该 进程 的 
存储 映像 (该 文件 名 为 core， 由 此 可 以 看 出 这 种 功能 很 久 以 前 就 是 UNIX 的 一 部 分 )。 大 多 数 
UNIX 调 试 程序 都 使 用 core 文 件 以 检查 进程 终止 时 的 状态 。 
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SIGABRT 
SIGALRM 
SIGBUS 
SIGCANCEL 
SIGCHLD 
SIGCONT 
SIGEMT 
SIGFPE 
SIGFREEZE 
SIGHUP 
SIGILL 
SIGINFO 
SIGINT 
SIGIO 
SIGIOT 
SIGKILL 
SIGLWP 
SIGPIPE 
SIGPOLL 
SIGPROF 


SIGPWR 
SIGQUIT 
SIGSEGV 
SIGSTKFLT 
SIGSTOP 
SIGSYS 
SIGTERM 
SIGTHAW 
SIGTRAP 
SIGTSTP 
SIGTTIN 
SIGTTOU 
SIGURG 
SIGUSRL 
SIGUSR2 
SIGVTALRM 


SIGWAITING 


SIGWINCH 


SIGXCPU 


SIGXFSZ 


SIGXRES 


异常 终止 (abort) 
超时 (alarm) 
硬件 故障 
线程 库 内 部 使 用 
子 进 程 状 态 改 变 
使 暂停 进程 继续 
硬件 故障 

算术 异常 
检查 点 冻结 
连接 断 开 

非法 硬件 指令 
键盘 状态 请 求 
终端 中 断 符 

异步 LO 

硬件 故障 

终止 
线程 库 内 部 使 用 
写 至 无 读 进程 的 管道 
可 轮 询 事件 (poll) 
梗概 时 间 超 时 
(setitimer) 
电源 失效 /重启 动 
终端 退出 符 
无 效 内 存 引用 

协 处 理 器 栈 故 障 


检查 点 解冻 

硬件 故障 

终端 停止 符 

后 台 读 控制 tty 

后 台 写 至 控制 tty 
紧急 情况 (BES) 
用 户 定义 的 信号 
用 户 定义 的 信号 
虚拟 时 间 阔 钟 
(setitimer) 
线程 库 内 部 使 用 
终端 窗口 大 小 改变 
超过 CPU 限制 
(setrlimit) 
超过 文件 长 度 限制 
(setrlimit) 


超过 资源 控制 


表 10-1 UNIX 系统 信和 号 
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Mac OS X 
10.3 


# ik +core 
终止 
终止 +core 


终止 +core 
终止 
忽略 
终止 
终止 
zi 


终止 /忽略 
终止 +core 
终止 +core 
Rik 
暂停 进程 
终止 +core 
终止 


忽略 
终止 +core/ 
忽略 
忽略 
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Core 文 件 是 大 多 数 UNIX 系 统 的 实现 特征 。 虽 然 该 特征 不 是 POSIX,1 的 组 成 部 分 ， 但 曾经 提 及 这 可 
能 作为 实现 特定 动作 成 为 Single UNIX Specification 的 XSI 扩 展 。 

在 不 同 的 实现 中 ，core 文 件 的 名 字 可 能 不 同 。 例 如 ， 在 FreeBSD 5.2.1 中 ，core 文 件 名 为 
cmdname.core， 其 中 cmdname 是 接收 到 信号 的 进程 所 执行 的 命令 名 。 在 Mac OS X 10.3 中 ，core 文 件 名 
是 core.pid， 其 中 ，pid 是 接收 到 信号 的 进程 的 ID。( 这 些 系统 允许 经 sysct1 参 数 配 置 core 文 件 名 。) 

大 多 数 实现 在 相应 进程 的 当前 工作 目录 中 看 放 core 文 件 ; 但 Mac OS 义 将 所 有 core 文 件 都 放置 在 


/cores B RF, 


2al 在 下 列 条 件 下 不 产生 core 文 件 : (a) 进程 是 设置 用 户 ID 的 ， 而 且 当 前 用 户 并 非 程序 文件 的 所 
292! 有 者 ，(b) 进程 是 设置 组 ID 的 ， 而 且 当 前 用 户 并 非 该 程序 文件 的 组 所 有 者 ，(c) 用 户 没 有 写 当前 
工作 目录 的 权限 ，(d) 文件 已 存在 ， 而 且 用 户 对 该 文件 设 有 写 权 限 ，(e) 文件 太 大 (回忆 7.11 节 
中 的 RLIMIT_CORE 限 制 )。core 文 件 的 权限 (假定 该 文件 在 此 之 前 并 不 存在 ) 通常 是 用 户 读 / 

写 , 但 Mac OS X 只 设置 为 用 户 读 。 
在 表 10-1 说 明 中 的 “硬件 故障 ”对 应 于 实现 定义 的 硬件 故障 。 这 些 名 字 中 有 很 多 取 自 UNIX 
早先 在 PDP-11 上 的 实现 。 请 查看 你 所 使 用 的 系统 手册 ， 以 确切 地 和 弄 清楚 这 些 信号 对 应 于 哪些 错 


误 类 型 。 





下 面 较 详 细 地 逐一 说 明 这 些 信 号 。 


SIGABRT 
SIGALRM 


SIGBUS 


SIGCANCEL 
SIGCHLD 


SIGCONT 


SIGEMT 


调用 abort 函 数 时 ( 见 10.17 节 ) 产生 此 信和 号。 进程 异常 终止 。 
在 用 alarm 函 数 设置 的 计时 器 超时 时 ， 产 生 此 信号 (详细 情况 见 10.10 节 ) 
若 由 setitimer(2) 函 数 设 置 的 间隔 时 间 超 时 时 ， 也 会 产生 此 信号 。 
指示 一 个 实现 定义 的 硬件 故障 。 当 出 现 某 些 类 型 的 内 存 故障 时 (如 14.9 节 中 
说 明 的 )， 实 现 常常 产生 此 种 信号 。 
这 是 Solaris 线 程 库 内 部 使 用 的 信号 。 它 不 供 一 般 应 用 。 
在 一 个 进程 终止 或 停止 时 ， 将 SIGCHLD 信 和 号 发 送 给 其 父 进 程 。 按 系统 默认 ， 
将 忽略 此 信号 。 如 果 父 进程 希望 被 告知 其 子 进程 的 这 种 状态 改变 ， 则 应 捕 
捉 此 信号 。 信 号 捕捉 函数 中 通常 要 调用 一 种 wait 函 数 以 取得 子 进程 ID 和 其 
终止 状态 。 

系统 V 的 早期 版 本 有 一 个 名 为 SIGCLD (XH) 的 类 似 信号 。 这 一 信和 号 
具有 与 其 他 信号 不 同 的 语义 ，SVR2 的 手册 页 警告 在 新 的 程序 中 尽量 不 要 使 
用 这 种 信号 。 令 人 惊讶 的 是 在 SVR3 和 SVR4 版 本 的 手册 页 中 , 该 警告 消失 了 。 
应 用 程序 应 当 使 用 标准 的 SIGCHLD 信 和 号， 但 应 了 解 ， 为 了 向 后 兼容 ， 很 多 
系统 定义 了 与 SIGCHLD 等 同 的 SIGCLD。( 如 果 有 使 用 SIGCLD 的 软件 ， 需 
要 查阅 系统 手册 ， 了 解 它 的 具体 语义 。) 10.7 节 将 讨论 这 两 个 信号 。 
此 作业 控制 信号 被 发 送 给 需要 继续 运行 ， 但 当前 处 于 停止 状态 的 进程 。 如 
果 接 收 到 此 信号 的 进程 处 于 停止 状态 ， 则 系统 默认 动作 是 使 该 进程 继续 运 
行 ， 否 则 默认 动作 是 忽略 此 信号 。 例 如 ， 全 屏幕 编辑 器 在 捕捉 到 此 信和 号 后 ， 
使 用 信号 处 理 程 序 发 出 重新 绘制 终端 屏幕 的 通知 。 关 于 进一步 的 情况 见 
10.20%, 
指示 一 个 实现 定义 的 硬件 故障 。 
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.  EMTik—£ TX &PDP-118j “GABBA” (emulator wap) 指令 。 并 非 所 有 平台 都 支持 此 信号 。 
例如 ，Linux 只 对 SPARC、MIPS 和 PA_RISC 等 体系 结构 支持 SIGEMT。 


SIGFPE 此 信号 表示 一 个 算术 运算 异常 ， 例 如 除 以 0， 浮 点 溢出 等 。 

SIGFREEZE 此 信号 仅 由 Solaris 定 义 。 它 用 于 通知 进程 在 冻结 系统 状态 之 前 需要 采取 特定 
动作 ， 例 如 当 系 统 进入 冬眠 或 挂 起 模式 时 可 能 需要 执行 这 种 处 理 。 

SIGHUP 如 果 终 端 接 口 检测 到 一 个 连接 断 开 ， 则 将 此 信号 发 送 给 与 该 终端 相关 的 控 
制 进程 (会话 首 进程 )。 见 图 9-11， 此 信号 被 送 给 session 结 构 中 的 s_ 
leader 字 段 所 指向 的 进程 。 仅 当 终 端的 CLOCAL 标 志 没 有 设置 时 ， 在 上 述 
条 件 下 才 产 生 此 信号 。( 如 果 所 连接 的 终端 是 本 地 的 ， 则 设置 该 终端 的 
CLOCAL 标 志 。 它 告诉 终端 驱动 程序 名 略 所 有 调制 解 调 器 的 状态 行 。 第 18 章 
将 说 明 如 何 设置 此 标志 。 

注意 ， 接 到 此 信号 的 会 话 首 进 程 可 能 在 后 台 , 例如， 参见 图 9-7。 这 有 
别 于 由 终端 正常 产生 的 几 个 信号 (中断 、 退 出 和 挂 起 )， 这 些 信号 总 是 传递 
给 前 台 进 程 组 。 

如 果 会 话 首 进程 终止 ， 则 也 产生 此 信号 。 在 这 种 情况 下 ， 此 信号 将 被 发 
送 给 前 台 进程 组 中 的 每 一 个 进程 。 

通常 用 此 信号 通知 守护 进程 ( 见 第 13 章 )， 以 重新 读 取 它们 的 配置 文件 。 
为 此 目的 选用 SIGHUP 的 理由 是 ， 守 护 进程 不 会 有 控制 终端 ， 而 且 通 常 决 不 
会 接收 到 这 种 信号 。 

SIGILL 此 信号 指示 进程 已 执行 一 条 非法 硬件 指令 。 


原先 ，4.3BSD 的 abort 函 数 产生 此 信号 。 现 在 该 函数 产生 SIGRABRT 信 号 。 


SIGINFO 这 是 一 种 BSD 信 号 ， 当 用 户 按 状 态 键 (一 般 采 用 Ctrit+T) 时 ， 终 端 驱动 程序 
产生 此 信号 并 送 至 前 台 进 程 组 中 的 每 一 个 进程 ( 见 图 9-8)。 此 信号 通常 导致 
在 终端 上 显示 前 台 进 程 组 中 各 进程 的 状态 信息 。 


除了 在 Alpha 平 台 上 将 SIGINFO 定 义 为 与 SIGPWR 具 有 相同 的 值 之 外 ，Linux 不 支持 这 种 信号 。 
SIGINT 当 用 户 按 中 断 键 (一般 采用 DELETE 或 Ctrlt+C) 时 ,终端 驱动 程序 产生 此 信 
号 并 送 至 前 台 进 程 组 中 的 每 一 个 进程 ( 见 图 9-8)。 当 一 个 进程 在 运行 时 失控 ， 
特别 是 它 正在 屏幕 上 产生 大 量 不 需要 的 输出 时 ， 常 用 此 信号 终止 它 。 
SIGIO 此 信号 指示 一 个 异步 WO 事件 。 在 14.6.2 节 中 将 对 此 进行 讨论 。 


在 表 10-1 中 ， 针 对 SIGIO 的 系统 默认 动作 是 终止 或 和 忽略。 不 幸 的 是 . 过 依赖 于 系统 。 在 系统 V 中 、 
SIGIO 与 SIGPOLL 相 同 ， 因 此 其 默认 动作 是 终止 此 进程 。 在 BSD 中 ， 其 默认 动作 是 忽略 此 信号 。 

Linux 2.4.224eSolaris 9 将 SIGIO 定 义 为 与 SIGPOLL 具 有 相同 的 值 ， 所 以 默认 行为 是 终止 该 进程 。 
在 FreeBSD 5.2.1 和 Mac OS X 10.3 中 ,默认 行为 是 忽略 该 信号 。 


SIGIOT 这 指示 一 个 实现 定义 的 硬件 故障 。 


1OT 这 个 名 字 来 自 于 PDP-11、 它 是 PDP-11 计 算 机 “输入 /输出 TRAP”(input/output TRAP) 指令 的 
缩写 。 在 系统 V 的 早期 版 本 中 ， 由 abort 函 数 产生 此 信号 。 该 函数 现在 产生 STGABRT 信 和 号， 
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| 
在 FreeBSD 5.2.1, Linux 24.22, Mac OS X 10.3 和 Solaris 9 中 将 SIGIOT 定 义 为 与 SIGABRT 具 有 相同 


的 值 。 


SIGKILL 


SIGLWP 
SIGPIPE 


SIGPOLL 


这 是 两 个 不 能 被 捕捉 或 忽略 的 信号 之 一 。 它 向 系统 管理 员 提供 了 一 种 可 以 
杀 死 任 一 进程 的 可 靠 方 法 。 

此 信号 由 Solaris 线 程 库 内 部 使 用 ， 并 不 作 一 般 使 用 。 

如 果 在 写 到 管道 时 读 进程 已 终止 ， 则 产生 此 信号 。15.2 节 将 说 明 管 道 。 当 类 
型 为 SOCK_STRERAM 的 套 接 字 已 不 再 连接 时 ， 进 程 写 到 该 套 接 字 也 产生 此 信 
号 。 我 们 将 在 第 16 章 说 明 套 接 字 。 

当 在 一 个 可 轮 询 设备 上 发 生 一 特定 事件 时 产生 此 信号 。14.5.2 节 将 说 明 pol1 
函数 和 此 信号 。 它 起 源 于 SVR3， 并 松散 对 应 于 BSD 的 SITGIO 和 SIGURG 信 和 号。 


在 Linux 和 Solaris 中 、SIGPOLL 被 定义 为 与 SIGIO 具 有 相同 的 值 。 


SIGPROF 


SIGPWR 


当 setitimer(2) 函 数 设 置 的 梗概 统计 间隔 计时 器 (profiling interval timer) 
已 到 期 时 产生 此 信号 。 

这 是 一 种 依赖 于 系统 的 信号 。 它 主要 用 于 具有 不 间断 电源 (UPS) HAR. 
如 果 电 源 失 效 ， 则 UPS 起 作用 ， 而 且 通 常 软件 会 接 到 通知 。 在 这 种 情况 下 ， 
系统 依靠 蔓 电 池 电 源 继续 运行 ， 所 以 无 须 任何 处 理 。 但 是 如 果 著 电池 也 将 
不 能 支持 工作 ， 则 软件 通常 会 再 次 接 到 通知 ， 此 时 ， 系 统 必 项 在 15 ~ 30 秒 
内 使 其 各 部 分 都 停止 运行 。 此 时 应 当 发 送 SIGPWR 信 号 。 在 大 多 数 系统 中 ， 
接 到 著 电 字 电 压 过 低 信息 的 进程 将 信号 SIGPWR 发 送 给 init 进 程 ， 然 后 由 
init 处 理 停 机 操作 。 


Linux 2.4.22 和 Solaris 9 在 inittab 文 件 中 有 两 个 项 用 于 此 种 目的 ， 它 们 是 powerfail 以 及 powerwait 


(或 powerokwait)。 


在 表 10-1 中 ， 我 们 将 SIGPWR 的 默认 动作 标记 为 :“ 终 止 ”或 者 “忽略 ”"。 不 幸 的 是 ， 这 种 默认 依 环 
于 系统 。Linux 的 默认 动作 是 终止 相关 进程 ，Solaris 的 默认 动作 是 忽略 该 信号 。 


SIGQUIT 


SIGSEGV 


当 用 户 在 终端 上 按 退 出 键 (一 般 采 用 Ctrl+\) 时 ， 产 生 此 信号 ， 并 送 至 前 台 
进程 组 中 的 所 有 进程 ( 见 图 9-8)。 此 信和 号 不 仅 会 终止 前 台 进 程 组 (如 
SIGINT 所 做 的 那样 ) ， 同 时 还 会 产生 一 个 core 文 件 。 

该 信号 指示 进程 进行 了 一 次 无 效 内 存 引用 。 


名 字 SEGV 表 示 “ 段 违例 (segmentation violation) ", 


SIGSTKFLT 此 信号 仅 由 Linux 定 义 。 它 出 现在 Linux 的 早期 版 本 ， 旨 在 用 于 数学 协 处 理 器 


SIGSTOP 


SIGSYS 


的 栈 故 障 。 该 信号 并 非 由 内 核 产 生 ， 但 仍 保留 以 向 后 兼容 。 

这 是 一 个 作业 控制 信号 ， 用 于 停止 一 个 进程 。 它 类 似 于 交互 停止 信和 号 
(SIGTSTP)， 但 是 SIGSTOP 不 能 被 捕捉 或 忽略 。 

该 信号 指示 一 个 无 效 的 系统 调用 。 由 于 某 种 未 知 的 原因 ， 进 程 执行 了 一 条 
机 器 指令 ， 内 核 认 为 这 是 一 个 系统 调用 ， 但 该 指令 指示 系统 调用 类 型 的 参 
数 却 是 无 效 的 。 这 种 情况 是 可 能 发 生 的 ， 例 如 ， 若 用 户 编写 了 一 道 使 用 新 
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系统 调用 的 程序 ， 然 后 尝试 运行 该 程序 的 二 进 制 可 执行 代码 ， 而 所 用 的 操 
作 系 统 却 是 不 支持 该 系统 调用 的 较 早 版 本 ， 于 是 就 会 出 现 上 述 情况 。 

SIGTERM 这 是 由 ki11(1) 命 令 发 送 的 系统 默认 终止 信号 。 

SIGTHAW 此 信和 号 仅 由 Solaris 定 义 。 当 系统 恢复 运行 被 挂 起 的 操作 时 ， 该 信号 用 于 通知 
相关 进程 ， 它 们 需要 采取 特殊 的 动作 。 

SIGTRAP 指示 一 个 实现 定义 的 硬件 故障 。 


此 信号 名 来 自 于 PDP-11 的 TRAP 指 令 。 当 执行 断 点 指令 时 、 实 现 常 用 此 信号 将 控制 转移 至 调试 程序 。 


SIGTSTP 交互 式 停 止 信号 ， 当 用 户 在 终端 上 按 挂 起 键 (一 般 采 用 Ctrl+Z) 时 ,终端 
动 程序 产生 此 信号 。 该 信号 送 至 前 台 进 程 组 中 的 所 有 进程 ee i 


REWR, Hab (stop) 这 个 术语 具有 不 同 的 含义 。 当 讨论 作业 控制 和 信号 时 ， 我 们 谈 及 停止 和 
继续 执行 作业 。 但 是 ， 终 端 驱 动 程序 一 直 使 用 术语 “停止 ”表示 用 Ctrl+S 字 符 停止 终端 输出 ,为 了 继 
续 启 动 该 终端 输出 ， 则 用 Ctrl+Q 字 符 。 为 此 、 终 端 驱 动 程序 称 产生 交互 式 停止 信号 的 字符 为 挂 起 字符 ， 
而 非 停止 字符。 


SIGTTIN 当 一 个 后 台 进 程 组 中 的 进程 试图 读 其 控制 终端 时 ， 终 端 驱动 程序 产生 此 信 
号 ( 见 9.8 节 中 对 此 问题 的 讨论 )。 在 下 列 特殊 情形 下 不 产生 此 信和 号: (a) i 
进程 忽略 或 阻塞 此 信号 ，(b) 读 进程 所 属 的 进程 组 是 孤儿 进程 组 ， 此 时 读 操 
作 返 回 出 错 ， 并 将 errno 设 置 为 EIO。 
SIGTTOU 当 一 个 后 台 进 程 组 中 的 进程 试图 写 到 其 控制 终端 时 产生 此 信号 ( 见 9.8 节 对 
此 主题 的 讨论 )。 与 上 面 所 述 的 SITGTTIN 信 号 不 同 ， 一 个 进程 可 以 选择 允许 
后 台 进 程 写 到 控制 终端 。 第 18 章 将 讨论 如 何 更 改 此 选项 。 
如 果 不 允 许 后 台 进 程 写 ， 则 与 SIGTTIN 相 似 ， 也 有 两 种 特殊 情况 : (a) 
写 进 程 忽略 或 阻塞 此 信号 ，(b) 写 进 程 所 属 进程 组 是 孤儿 进程 组 。 在 这 两 种 
pde v 写 操作 返回 出 错 ， 并 将 errno 设 置 为 EIO。 
论 是 否 人 允许 后 台 进 程 写 ， 某 些 除 写 以 外 的 下 列 终端 操作 也 能 产生 此 信 
d tcsetattr, tcsendbreak, tcdrain, tcflush, tcflow[AA 
tcsetpgrp。 第 18 章 将 说 明 这 些 终端 操作 。 
SIGURG 此 信号 通知 进程 已 经 发 生 一 个 紧急 情况 。 在 网 络 连 接 上 接收 到 带 外 的 数据 
时 ， 可 选择 产生 此 信号 。 
SIGUSR1 这 是 一 个 用 户 定义 的 信号 ， 可 用 于 应 用 程序 。 
SIGUSR2 这 是 另 一 个 用 户 定义 的 信号 ， 与 SIGUSR1 相 似 ， 可 用 于 应 用 程序 。 
SIGVTALRM 当 一 个 由 setitimer(2) 函 数 设置 的 虚拟 间隔 时 间 到 期 时 产生 此 信号 。 
SIGWAITING 此 信号 由 Solaris 线 程 库 内 部 使 用 ， 不 作 它 用 。 
SIGWINCH ”内 核 维 持 与 每 个 终端 或 伪 终 端 相关 联 的 窗口 大 小 。 进 程 可 以 用 ioct1 函 数 
( 见 18.12 节 的 说 明 ) 得 到 或 设置 窗口 的 大 小 。 如 果 进 程 用 ioct1 的 设置 窗口 大 
小 命令 更 改 了 窗口 大 小 ， 则 内 核 产生 SIGWINCH 信 号 并 将 其 送 至 前 台 进 程 组 。 
SIGXCPU Single UNIX Specification 和 的 XSI 扩 展 支持 资源 限制 的 概念 ( 见 7.11 节 )。 如 果 
进程 超过 了 其 软 CPU 时 间 限 制 ， 则 产生 SIGXCPU 信 号 。 
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在 表 10-1 中 ， 针 对 STGXCPU 的 默认 动作 被 标记 为 “终止 并 创建 core 文 件 ” 或 “忽略 "。 不 幸 的 是 ， 
该 默认 动作 依赖 于 操作 系统 。Linux 2.4.22 和 Solaris 9 支持 的 默认 动作 是 “ 终 正 并 创建 core 文 件 ” ; 
FreeBSD 5.2.1 和 Mac OS X 10.3 支 持 的 默认 动作 是 “忽略 "。Single UNIX Specification 要 求 该 默认 动作 
是 异常 终止 该 进程 ， 是 否 创 建 core 文 件 则 留 给 实现 决定 。 


SIGXFSZ 如 果 进 程 超过 了 其 软文 件 长 度 限制 ( 见 7.11 节 )， 则 产生 此 信号 。 


如 同 SIGXCPU 一 样 、 针 对 SIGXFSZ 的 默认 动作 依赖 于 操作 系统 。Linux 2.4.22 和 Solaris 9 对 此 信号 
的 默认 动作 是 “终止 进程 并 创建 core 文 件 ”。FreeBSD 5.2.1 和 Mac OS X 10.3 支 持 的 默认 动作 是 “忽略”。 
Single UNIX Specification 要 求 该 默认 动作 是 异常 终止 该 进程 ， 是 否 创 建 core 文 件 则 留 给 实现 决定 。 


SIGXRES 此 信号 仅 由 Solaris 定 义 。 可 选择 使 用 此 信和 号 以 通知 进程 超过 了 预 配 置 的 资源 
值 。Solaris 资 源 限制 机 制 是 一 种 通用 设施 ， 用 于 控制 在 独立 应 用 程序 集 之 间 
使 用 共享 资源 。 


10.3 signal mA 
UNIX 系 统 的 信号 机 制 最 简单 的 接口 是 signal 函 数 。 


#include «signal.h» 


void (*signal (int signo, void (*func) (int))) (int); 
返回 值 ， 若 成 功 则 返回 信号 以 前 的 处 理 配 置 ( 见 下 )， 若 出 错 则 返回 SIG_ERR 








signal Ağ HISO C 定 义 。 因 为 ISO C 不 涉及 多 进程 、 进 程 组 以 及 终端 VO 等 ， 所 以 它 对 信号 的 定 
义 非 常 含糊 ， 以 至 于 对 UNIX 系 统 而 言 几 平帝 无 用 处 。 

从 UNIX 系统 V 派 生 的 实现 支持 signal1 函 数 ， 但 该 函数 提供 加 的 不 可 靠 信号 语义 (10.4 节 将 说 明 
这 些 旧 语义 ) 。 提 供 此 函数 主要 是 为 了 向 后 兼容 那些 需要 此 旧 语 义 的 应 用 程序 ， 疡 应 用 程序 不 应 使 用 这 
些 不 可 人 靠 信号 。 

4.4BSD 也 提供 signal 函 数 , 但 它 是 按照 sigaction 函 数 定义 的 《10.14 节 将 说 明 sigaction 函 数 ) ， 
所 以 在 4.4BSD 之 下 使 用 它 提 供 新 的 可 靠 信号 语义 。FreeBSD 和 Mac OS X38 1f 969 KB, 

Solaris 9 植 报 于 系统 V 和 BSD， 但 在 signal 函 数 方面 ， 它 依从 系统 V 语 义 。 

Linux 2.4.22 的 sigmnal 语 义 依 从 BSD 或 者 系统 V， 这 取决 于 C 函 数 库 的 版 本 ， 以 及 编译 应 用 程序 的 

因为 signal 的 语义 与 实现 有 关 ， 所 以 最 好 使 用 sigaction 函 数 代 替 signal 函 数 。 在 10.4 节 讨论 
sigaction 函 数 时 ， 提 供 了 使 用 该 函数 的 一 个 signal 实 现 。 本 书 中 的 所 有 实例 均 使 用 程序 清单 10-12 
PH signal hx, 


signo 参 数 是 表 10-1 中 的 信号 名 。finc 的 值 是 常量 SIG_IGN、 常 量 SIG_DFL 或 当 接 到 此 信号 
后 要 调用 的 函数 的 地 址 。 如 果 指 定 SIG_IGN， 则 向 内 核 表 示 忽 略 此 信号 ( 记 住 有 两 个 信和 号 
SIGKILL 和 SIGSTOP 不 能 名 上 略 )。 如 果 指 定 SIG_DFL， 则 表示 接 到 此 信号 后 的 动作 是 系统 默认 
动作 ( 见 表 10-1 中 的 最 后 1 列 )。 当 指定 函数 地 址 时 ， 则 在 信号 发 生 时 ， 调 用 该 函数 ， 我 们 称 这 
种 处 理 为 “ 捕 所 ”该 信号 。 称 此 函数 为 信号 处 理 程序 (signal handler) 或 信号 捕捉 函数 
(signal-catching function) 。 


signal 函 数 原型 说明 此 函数 需要 两 个 参数 ， 返 回 一 个 函数 指针 ， 而 该 指 针 所 指向 的 函数 
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无 返回 值 (void)。 第 一 个 参数 signo 是 一 个 整数 ， 第 二 个 参数 是 函数 指针 ， 它 所 指向 的 函数 需 
要 一 个 整 型 参数 ， 无 返回 值 。signal 的 返回 值 是 一 个 函数 地 址 ， 该 函数 有 一 个 整 型 参数 〈 即 
最 后 的 (int))。 用 自然 语言 来 描述 也 就 是 要 向 信号 处 理 程序 传送 一 个 整 型 参数 ， 而 它 却 无 返 
回 值 。 当 调用 signal 设 置信 号 处 理 程序 时 ， 第 二 个 参数 是 指向 该 函数 (也 就 是 信号 处 理 程序 ) 
的 指针 。signal 的 返回 值 则 是 指向 之 前 的 信号 处 理 程序 的 指针 。 


很 多 系统 用 附加 的 依赖 于 实现 的 参数 来 调用 信号 处 理 程序 。10.14 节 将 对 此 作 进一步 说 明 。 


本 节 开 头 所 示 的 signal 国 数 原型 太 复杂 了 ， 如 果 使 用 下 面 的 typedef[Plauger 1992]， 则 
可 使 其 简单 一 些 。 

typedef void Sigfunc(int); 
然后 ， 可 将 signal 函 数 原型 写成 

Sigfunc *signal (int, Sigfunc *); 
我 们 已 将 此 typedef 包 括 在 apue .h 文 件 中 ( 见 附录 B)， 并 随 本 章 中 的 函数 一 起 使 用 。 

如 果 查 看 系统 的 头 文件 <signal .h>， 则 很 可 能 会 找到 下 列 形式 的 声明 : 

#define SIG ERR (void (*)0)-1 

#define SIG DFL (void (*)())0 

#define SIG IGN (void (*)())1 
这 些 常 量 可 用 于 代替 “指向 函数 的 指针 ， 该 函数 需要 一 个 整 型 参数 ， 而 且 无 返回 值 ”。signal 
的 第 二 个 参数 及 其 返回 值 就 可 用 它们 表示 。 这 些 常量 所 使 用 的 三 个 值 不 一 定 是 -1，0 和 1。 它 们 
必须 是 三 个 值 而 决 不 能 是 任 一 可 声明 函数 的 地 址 。 大 多 数 UNIX 系 统 使 用 上 面 所 示 的 值 。 


x y 
程序 清单 10-! 显 示 了 一 个 简单 的 信号 处 理 程序 ， 它 捕捉 两 个 用 户 定义 的 信号 并 打印 信号 编 
号 。10.10 节 将 说 明 pause 函 数 ， 它 使 调用 进程 在 接 到 一 个 信号 前 挂 起 。 299 


程序 清单 10-1 捕捉 STGUSR1 和 sIGUSR2 的 简单 程序 
#include "apue.h" 
static void sig usr(int); /* one handler for both signals */ 
int 


main(void) 


{ 


if (signal (SIGUSR1, sig usr) == SIG ERR) 
err sys("can't catch SIGUSR1"); 

if (signal(SIGUSR2, sig usr) -- SIG ERR) 
err sys("can't catch SIGUSR2"); 

LOR C0) 
pause () ; 


} 


static void 
sig usr(int signo) /* argument is signal number */ 
{ 
if (signo == SIGUSR1) 
printf ("received SIGUSR1Mn"); 
else if (signo == SIGUSR2) 
printf ("received SIGUSR2\n") ; 
else 
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err dump("received signal %d\n", signo); 


) 


Su ia SHE. FAK e dH SaaS Ee. EM, UNIX, KK 


(kill) 这 个 术语 是 不 恰当 的 。kil11(b 命 令 和 ki11(2) 函 数 只 是 将 一 个 信号 送 给 一 个 进程 或 进程 
组 。 信 号 是 否 终止 进程 则 取决 于 信号 的 类 型 ， 以 及 进程 是 否 安排 了 捕 提 该 信号 。 


$ ./a.out & 在 后 台 启 动 进程 

[1] 7216 作业 控制 shel 打 印 作业 号 和 进程 

$ kill -USR1 7216 向 该 进程 发 送 SIGUSR1 

received SIGUSR1 

$ kill -USR2 7216 向 该 进程 发 送 STGUSR2 

received SIGUSR2 

$ kill 7216 向 该 进程 发 送 SIGTERM 

[1]* Terminated ./a.out 

因为 执行 程序 清单 10-1 的 进程 不 捕 提 SIGTERM 信 号, 而 针对 该 信号 的 系统 默认 动作 是 终止 ， 
所 以 当 向 该 进程 发 送 SIGTERM 信 号 后 ， 该 进程 就 会 终止 。 o 

1. 程序 启动 


当 执行 一 个 程序 时 ， 所 有 信号 的 状态 都 是 系统 默认 或 忽略 。 通 常 所 有 信号 都 被 设置 为 它们 
的 默认 动作 ， 除 非 调用 exec 的 进程 忽略 该 信和 号。 确切 地 讲 ，exec 函数 将 原先 设置 为 要 捕 提 的 
信号 都 更 改 为 它们 的 默认 动作 ， 其 他 信号 的 状态 则 不 变 (对 于 一 个 进程 原先 要 捕捉 的 信号 ， 当 
其 执行 一 个 新 程序 后 ， 就 自然 不 能 再 捕捉 它 了 ， 因 为 信号 捕 提 函数 的 地 址 很 可 能 在 所 执行 的 新 
程序 文件 中 已 无 意义 )。 

一 个 具体 例子 是 一 个 交互 式 shell 如 何 处 理 针对 后 台 进程 的 中 断 和 退出 信号 。 对 于 一 个 非 作 
业 控 制 shell， 当 在 后 台 执 行 一 个 进程 时 ， 例 如 ， 

ce main.c & 
shell 自 动 将 后 台 进 程 对 中 断 和 退出 信号 的 处 理 方式 设置 为 忽略 。 于 是 ， 当 按 中 断 键 时 就 不 会 影 
响 到 后 台 进程 。 如 果 没 有 执行 这 样 的 处 理 ， 那 么 当 按 中 断 键 时 ， 它 不 但 会 终止 前 台 进 程 ， 还 会 
终止 所 有 后 台 进 程 。 

很 多 捕捉 这 两 个 信号 的 交互 式 程序 具有 下 列 形式 的 代码 ， 


void sig int(int), sig quit (int); 


if (signal(SIGINT, SIG IGN) !- SIG IGN) 
Signal(SIGINT, sig int); 
if (signal(SIGQUIT, SIG IGN) !- SIG IGN) 


signal(SIGQUIT, sig quit); 

这 样 处 理 后 ， 仅 当 信号 当前 未 被 忽略 时 ， 进 程 才 会 捕捉 它们 。 

从 signal 的 这 两 个 调用 中 也 可 以 看 到 这 种 函数 的 限制 ,不 改变 信和 号 的 处 理 方 式 就 不 能 确 
定 信 号 的 当前 处 理 方式 。 我 们 将 在 本 章 的 稍 后 部 分 说 明 使 用 sigaction 函 数 可 以 确定 一 个 信 
号 的 处 理 方式 ， 而 无 需 改变 它 。 

2. 进程 创建 

当 一 个 进程 调用 fork 时 ， 其 子 进程 继承 父 进程 的 信号 处 理 方式 。 因 为 子 进程 在 开始 时 复 
制 了 父 进程 的 存储 映像 ， 所 以 信号 捕 提 函数 的 地 址 在 子 进程 中 是 有 意义 的 。 


104 不 可 靠 的 信号 
在 早期 的 UNIX 版 本 (例如 V7) 中 ,信号 是 不 可 靠 的 。 不 可 靠 在 这 里 指 的 是 ， 信 号 可 能 会 
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BR: 一 个 信号 发 生 了 ， 但 进程 却 可 能 一 直 不 知道 这 一 点 。 同 时 ， 进 程 对 信号 的 控制 能 力也 很 
差 ， 它 能 捕捉 信号 或 忽略 它 。 有 时 用 户 希 望 通知 内 核 阻塞 一 个 信号 : 不 要 忽略 该 信号 ， 在 其 发 
生 时 记 住 它 ， 然 后 在 进程 做 好 准备 时 再 通知 它 。 这 种 阻塞 信号 的 能 力 当时 并 不 具备 。 


4.2BSD 对 信号 机 制 进 行 了 更 改 ， 提 供 了 被 称 为 可 靠 信号 的 机 制 。 然 后 ，SVR3 也 修改 了 信号 机 制 ， 
提供 了 另 一 套 系 统 V 可 靠 信号 机 制 。POSIX.1 选 择 了 BSD 模 型 作为 其 标准 化 的 基础 。 


早期 版 本 中 的 一 个 问题 是 在 进程 每 次 接 到 信号 对 其 进行 处 理 时 ， 随 即将 该 信号 动作 复位 为 
默认 值 〈 在 前 面 运行 程序 清单 10-1 时 ， 我 们 只 捕捉 每 种 信号 一 次 ， 从 而 回避 了 这 一 点 ) ffi 
述 这 些 早期 系统 的 编程 书籍 中 ， 有 -- 个 经 典 实例 ， 它 与 如 何 处 理 中 断 信 号 相关 ， 其 代码 与 下 面 
所 示 的 相似 : 


int sig int(); /* my signal handling function */ 
Signal(SIGINT, sig int); /* establish handler */ 


sig int() 


Signal(SIGINT, sig int); /* reestablish handler for next time */ 
"e /* process the signal ... */ 
} 


《由 于 早期 的 C 语 言 版 本 不 支持 ISO C 的 void 数据 类 型 ， 所 以 将 信号 处 理 程序 声明 为 int 类 型 。) 

这 段 代码 的 一 个 间 题 是 ， 从 信号 发 生 之 后 到 在 信号 处 理 程序 中 调用 signal 函 数 之 前 这 段 
时 间 中 有 一 个 时 间 窗 口 。 在 此 段 时 间 中 ， 可 能 发 生 另 一 次 中 断 信号 。 第 二 个 信和 号 会 导致 执行 默 
认 动 作 ， 而 针对 中 断 信号 的 默认 动作 是 终止 该 进程 。 这 种 类 型 的 程序 自在 大 多 数 情况 下 会 正常 
工作 ， 使 得 我 们 认为 它们 是 正确 无 误 的 ， 而 实际 上 并 非 如 此 。 

这 些 早 期 系统 的 另 一 个 问题 是 : 在 进程 不 希望 某 种 信号 发 生 时 ， 它 不 能 关闭 该 信号 。 进 程 
能 做 的 一 切 就 是 忽略 该 信号 。 有 时 希望 通知 系统 “阻止 下 列 信号 发 生 ， 如 果 它 们 确实 产生 了 ， 
请 记 住 它们 。 能够 显现 这 种 缺陷 的 一 个 经 典 实例 是 下 列 程序 段 ， 它 捕捉 一 个 信号 ， 然 后 设置 
一 个 表示 该 信号 已 发 生 的 标志 : 

int Sig int flag; /* set nonzero when signal occurs */ 


main() 
int sig int(); /* my signal handling function */ 
Signal(SIGINT, sig int); /* establish handler */ 


while (sig int flag == 0) 
pause() ; f 


* 


go to sleep, waiting for signal */ 

] 

sig int() 
Signal(SIGINT, sig int); /* reestablish handler for next time */ 
Sig int flag - 1; /* set flag for main loop to examine */ 


} 
Re. HRD ApauseMhREACHIR, HEREA. MaS, Se 
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序 将 标志 sig_int_flag 设 置 为 非 0 值 。 从 信号 处 理 程序 返回 后 ， 内 核 自 动 将 该 进程 唤醒 ， 它 
检测 到 该 标志 为 非 0， 然 后 执行 它 所 需 做 的 工作 。 但 是 这 里 也 有 一 个 时 间 窗 口 ， 在 此 窗口 中 操 
作 可 能 失误 。 如 果 在 测试 sig_int_flag 之 后 和 调用 pause 之 前 发 生 信 号 ， 则 此 进程 在 调用 
pause 时 入 睡 ， 并 且 长 眠 不 醒 (假定 此 信号 不 会 再 次 产生 )。 于 是 ， 这 次 发 生 的 信和 号 也 就 丢失 
了 。 这 是 另 一 个 例子 ， 某 段 代 码 并 不 正确 ， 但 是 大 多 数 时 间 却 能 正常 工作 。 要 查找 并 排除 这 种 
类 型 的 问题 很 困难 。 


10.5 中 断 的 系统 调用 


早期 UNIX 系 统 的 一 个 特性 是 : 如 果 进 程 在 执行 一 个 低速 系统 调用 而 阻塞 期 间 捕捉 到 一 个 
言 号 ， 则 该 系统 调用 就 被 中 断 不 再 继续 执行 。 该 系统 调用 返回 出 错 ， 其 errno 被 设置 为 EINTR。 
这 样 处 理 的 理由 是 : 因为 一 个 信号 发 生 了 ， 进 程 捕 捉 到 了 它 ， 这 意味 着 已 经 发 生 了 某 种 事情 ， 
所 以 是 个 应 当 唤 醒 阻 塞 的 系统 调用 的 好 机 会 。 


在 这 里 ， 我 们 必须 区 分 系统 调用 和 函数 。 当 捕捉 到 菜 个 信号 时 ， 被 中 断 的 是 内 核 中 执行 的 系统 调用 。 


为 了 支持 这 种 特性 ， 将 系统 调用 分 成 两 类 : 低速 系统 调用 和 其 他 系统 调用 。 低 速 系 统 调用 
是 可 能 会 使 进程 永远 阻塞 的 一 类 系统 调用 ， 它 们 包括 ; 
“ 在读 某 些 类 型 的 文件 (管道 、 终 端 设备 以 及 网 络 设备 ) 时 ， 如 果 数 据 并 不 存在 则 可 能 会 
使 调用 者 永远 阻塞 。 
“在 写 这 些 类 型 的 文件 时 ， 如 果 不 能 立即 接受 这 些 数 据 ， 则 也 可 能 会 使 调用 者 永远 阻塞 。 
“ 打开 某 些 类 型 文件 ， 在 某 种 条 件 发 生 之 前 也 可 能 会 使 调用 者 阻塞 〈 例 如， 打开 终端 设备 ， 
它 要 等 待 直到 所 连接 的 调制 解 调 器 应 答 了 电话 )。 
*pause (按照 定义 ， 它 使 调用 进程 休眠 直至 捕捉 到 一 个 信号 ) 和 wait 函 数 。 
。 某 些 ioct1 操 作 。 
。 某 些 进程 间 通 信和 函数 ( 见 第 15 章 )。 
在 这 些 低速 系统 调用 中 ， 一 个 值得 注意 的 例外 是 与 磁盘 VO 有 关 的 系统 调用 。 虽 然 读 、 写 一 个 磁 
盘 文件 可 能 暂时 阻塞 调用 者 (在 磁盘 驱动 器 将 请 求 排 人 队列 ， 然 后 在 适当 时 间 执 行 请 求 期 间 )， 
但 是 除非 发 生硬 件 错误 ，L/O 操 作 总 会 很 快 返回 ， 并 使 调用 者 不 再 处 于 阻塞 状态 。 
可 以 用 中 断 系统 调用 这 种 方法 来 处 理 的 一 个 例子 是 : 一 个 进程 启动 了 读 终端 操作 ， 而 使 用 
该 终端 设备 的 用 户 却 离开 该 终端 很 长 时 间 。 在 这 种 情况 下 进程 可 能 处 于 阻塞 状态 几 个 小 时 甚至 
数 天 ， 除 非 系统 停机 ， 否 则 一 直 如 此 。 


对 于 中 断 的 read、write 系 统 调 用 ，POSIX.1 的 语义 在 该 标准 的 2001 版 有 所 改变 。 对 于 如 何 处 理 
已 read、write 部 分 数据 量 的 相应 系统 调用 ,早期 版 本 允许 实现 进行 选择 。 如 若 read 系 统 调用 已 接收 
并 传送 数据 至 应 用 程序 线 冲 区 ， 但 尚未 接收 到 应 用 程序 请 求 的 全 部 数据 ， 此 时 被 中 断 ，、 操 作 系统 可 以 
认为 该 系统 调用 失败 、 并 将 errno 设 置 为 EINTR; 另 一 种 处 理 方式 是 多 许 该 系统 调用 成 功 返 回 ， 返回 已 
接收 到 的 部 分 数据 量 。 与 此 类 似 ， 如 车 write 已 传输 了 应 用 程序 线 冲 区 中 的 部 分 数据 ， 然 后 被 中 断 ， 
操作 系统 可 以 认为 该 系统 调用 失败 ， 并 将 errno 设 置 为 EINTR; 另 一 种 处 理 方式 是 允许 该 系统 调用 成 功 
有 返回， 返回 已 写 的 部 分 数据 量 。 历 史上 ， 从 系统 V 派 生 的 实现 ， 将 这 种 系统 调用 视 为 失败 ， 而 BSD 派 生 
的 实现 则 处 理 为 部 分 成 功 返 回 。POSIX.1 标 准 的 2001 版 采用 BSD 风 格 的 语义 。 


与 被 中 断 的 系统 调用 相关 的 问题 是 必须 显 式 地 处 理 出 错 返 回 。 典 型 的 代码 序列 (假定 进行 
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一 个 读 操作 ， 它 被 中 断 ， 我 们 希望 重新 启动 它 ) 可 能 如 下 所 示 : 
again: 
if ((n = read(fd, buf, BUFFSIZE)) < 0) { 
if (errno == EINTR) 


goto again; /* just an interrupted system call */ 
/* handle other errors */ 


为 了 帮助 应 用 程序 使 其 不 必 处 理 被 中 断 的 系统 调用 ，4.2BSD 引 和 人 了 某 些 被 中 断 系统 调用 的 
自动 重启 动 。 自 动 重启 动 的 系统 调用 包括 ioctl、readG、readGv、write、writev、wait 和 
waitpid。 正 如 前 述 ， 其 中 前 5 个 函数 只 有 对 低速 设备 进行 操作 时 才 会 被 信号 中 断 。 而 wait 和 
waitpid 在 捕捉 到 信号 时 总 是 被 中 断 。 因 为 这 种 自动 重启 动 的 处 理 方式 也 会 带 来 问题 ， 所 以 某 
些 应 用 程序 并 不 希望 这 些 函 数 被 中 断后 重启 动 。 为 此 4.3BSD 允 许 进程 基于 每 个 信号 禁用 此 功能 。 


POSIX.1 允 许 实现 重启 动 系统 调用 ， 但 这 并 不 是 必需 的 。Single UNIX Specification 将 SA_RESTART 
定义 为 对 sigaction 的 SI 扩展， 以 允许 应 用 程序 要 求 重启 动 被 中 断 的 系统 调用 。 

系统 V 的 默认 工作 方式 是 从 不 重启 动 系统 调用 。 而 BSD 则 重启 动 被 信号 中 断 的 系统 调用 。FreeBSD 
52.1, Linux 2.4.22 和 Mac OS X 10.3 的 默认 方式 是 重启 动 由 信号 中 断 的 系统 调用 。Solaris 9 的 默认 方式 
是 出 错 返回 ， 并 将 errno 设 置 为 EINTR。 


4.2BSD 引 入 自动 重启 动 功能 的 一 个 理由 是 : 有 时 用 户 并 不 知道 所 使 用 的 输入 、 输 出 设备 是 
否 是 低速 设备 。 如 果 我 们 编写 的 程序 可 以 用 交互 方式 运行 ， 则 它 可 能 读 、 写 低速 终端 设备 。 如 
果 在 程序 中 捕捉 信号 ， 而 且 系 统 并 不 提供 重启 动 功能 ， 则 对 每 次 读 、 写 系统 调用 都 要 进行 是 否 
出 错 返 回 的 测试 ， 如 果 是 被 中 断 的 ， 则 再 调用 读 、 写 系统 调用 。 

表 10-2 列 出 了 几 种 实现 所 提供 的 与 信号 有 关 的 函数 及 其 语义 。 


表 10-2 几 种 信号 实现 所 提供 的 功能 
ee 阻塞 信号 | 被 中 断 的 系统 调 


ISOC, fisoc, posix) | | xw | 末 说 明 未 说 明 
V7、SVR2、SVR3、SVR4、Solaris 





























Signal 








S a JL 








D [E 2BSD 








EM 3BSD, 44BSD, FreeBSD, Mac OS X 
sigaction 


44BSD. SVR4. FreeBSD, Mac OS X, 
Linux, Solarıs 


我 们 没有 讨论 田 的 sigset 和 sigvec 函 数 。 它 们 已 由 sigaction 函 数 替 代 ; 仅仅 为 了 完整 性 我 们 
才 将 远 两 个 函数 包含 在 表 10-2 中 。 与 之 对 照 ， 某 些 实 现 将 signal 函数 提升 为 sigaction 的 简化 接口 。 
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应 当 了 解 ， 其 他 厂商 提供 的 UNIX 系 统 可 能 不 同 于 表 10-2 中 所 示 的 情况 。 例 如 ，SunOS 4.1.2 
中 的 sigaction 的 默认 方式 是 重启 动 被 中 断 的 系统 调用 ， 这 与 表 10-2 中 所 列 的 各 平台 不 同 。 

在 程序 清单 10-12 中 ， 提 供 了 我 们 自己 的 signa1 函 数 版 本 ， 它 自动 地 试图 重启 动 被 中 断 的 
系统 调用 ( 除 SIGALRM 信 号 外 )。 在 程序 清单 10-13 中 则 提供 了 另 一 个 函数 signal_intr, © 
从 不 尝试 进行 重启 动 。 

14.5 节 说 明 select 和 pol1 函 数 时 还 将 涉及 被 中 断 的 系统 调用 的 更 多 知识 。 


10.6 可 重 入 函数 


进程 捕捉 到 信号 并 对 其 进行 处 理 时 ， 进 程 正在 热 行 的 指令 序列 就 被 信号 处 理 程序 临时 中 断 ， 
它 首先 执行 该 信号 处 理 程序 中 的 指令 。 如 果 从 信和 号 处 理 程序 返回 (例如 没有 调用 exit 或 
longjmp)， 则 继续 执行 在 捕捉 到 信号 时 进程 正在 执行 的 正常 指令 序列 (这 类 似 于 发 生硬 件 中 
断 时 所 做 的 )。 但 在 信号 处 理 程序 中 ， 不 能 判断 捕 提 到 信号 时 进程 在 何 处 执行 。 如 果 进 程 正 在 
执行 malloc， 在 其 堆 中 分 配 另 外 的 存储 空间 ， 而 此 时 由 于 捕捉 到 信和 号 而 播 入 执行 该 信号 处 理 
程序 ， 其 中 又 调用 mal1loc， 这 时 会 发 生 什么 ? 又 例如 车 进程 正在 执行 getpwnam ( 见 6.2 节 ) 
这 种 将 其 结果 存放 在 静态 存储 单元 中 的 函数 ， 其 间 插 入 执行 信号 处 理 程序 ， 它 又 调用 这 样 的 函 
数 ， 这 时 又 会 发 生 什 么 呢 ? 在 malloc 例 子 中 ， 可 能 会 对 进程 造成 破坏 ， 因 为 malloc 通 常 为 它 
所 分 配 的 存储 区 维护 一 个 链接 表 ， 而 插入 执行 信号 处 理 程序 时 ， 进 程 可 能 正在 更 改 此 链接 表 。 


在 getpwnam 的 例子 中 ， 返 回 给 正常 调用 者 的 信息 可 能 被 返回 给 信号 处 理 程序 的 信息 覆盖 。 
Single UNIX Specification 说 明了 保证 可 重信 的 函数 。 表 10-3 列 出 了 这 些 可 重信 函数 。 


表 10-3 信和 号 处 理 程序 可 以 调用 的 可 重 入 函数 


accept 
access 
aio_error 
aio_return 
aio_suspend 
alarm 

bind 
cfgetispeed 
cfgetospeed 
cfsetispeed 
cfsetospeed 
chdir 

chmod 

chown 
clock_gettime 
close 
connect 
creat 

dup 

dup2 

execie 
execve 


.Exit& exit 


fchmod 
fchown 
fcnti 
fdatasync 
fork 
fpathconf 
fstat 
fsync 





ftruncate 
getegid 
geteuid 
getgid 
getgroups 
getpeername 
getpgrp 
getpid 
getppid 
getsockname 
getsockopt 
getuid 

kill 

link 

listen 





lseek 
istat 
mkdir 
mkfifo 
open 
pathconf 
pause 
pipe 
poil 


posix, trace, event 


pselect 
raise 
read 
readiink 
recv 
recvfrom 
recvmsg 
rename 
rmdir 
Select 
sem post 
send 
sendmsg 


sendto 
setgid 
setpgid 
setsid 
setsockopt 
setuid 
shutdown 
sigaction 
sigaddset 
sigdelset 
sigemptyset 
sigfiliset 
sigismember 
signal 
sigpause 
sigpending 
sigprocmask 
sigqueue 
sigset 
sigsuspend 
sleep 
socket 


socketpair 
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stat 

symlink 
sysconf 
tcdrain 
tcflow 
tcfiush 
tcgetattr 
tcgetpgrp 
tcsendbreak 
tcsetattr 
tcsetpgrp 
time 

timer getoverrun 
timer gettime 
timer settime 
times 

umask 

uname 

unlink 

utime 

wait 

waitpid 


write 
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没有 列 入 表 10-3 中 的 大 多 数 函 数 是 不 可 重 入 的 ， 其 原因 为 :，(a) 已 知 它们 使 用 静态 数据 结 
XJ, (b) 它们 调用 malloc 或 ftree， 或 (c) 它们 是 标准 WO 函数 。 标 准 1O 库 的 很 多 实现 都 以 不 可 
重 入 方式 使 用 全 局 数据 结构 。 注 意 ， 即 使 在 本 书 的 某 些 实例 中 ， 信 和 号 处 理 程 序 也 调用 了 
printf 函 数 ， 但 这 并 不 保证 产生 所 期 望 的 结果 ， 信 号 处 理 程序 可 能 中 断 主 程序 中 的 printf 
函数 调用 。 

应 当 了 解 即使 信号 处 理 程序 调用 的 是 列 于 表 10-3 中 的 函数 ， 但 是 由 于 每 个 线程 只 有 一 个 
errno 变 量 (回忆 1.7 节 对 errno 和 线程 的 讨论 )， 所 以 信号 处 理 程序 可 能 会 修改 其 原先 值 。 考 
虚 一 个 信号 处 理 程序 ， 它 恰好 在 main 刚 刚 设置 errno 之 后 被 调用 。 例 如 ， 如 果 访 信号 处 理 程 
序 调用 read 这 类 函数 ， 则 它 可 能 更 改 errno 的 值 ， 从 而 取代 了 刚刚 由 main 设 置 的 值 。 因 此 ， 
作为 一 个 通用 的 规则 ， 当 在 信号 处 理 程 序 中 调用 表 10-3 中 列 出 的 函数 时 ， 应 当 在 其 前 保存 ， 在 
其 后 恢复 errno。( 应 当 了 解 ， 经 常 被 捕 提 到 的 信号 是 SIGCHLD， 基 信号 处 理 程序 通常 要 调用 
一 种 wait 函 数 ， 而 各 种 wait 函 数 都 能 改变 errno。) 

注意 ， 表 10-3 没 有 包括 longjmp (7.10 节 ) 和 siglongjmp (10.15 节 )。 这 是 因为 主 例 程 
以 非 可 重 入 方式 正在 更 新 数据 结构 时 可 能 产生 信和 号。 如果 不 是 从 信号 处 理 程序 返回 而 是 调用 
siglongjmp， 那 么 该 数据 结构 可 能 是 部 分 更 新 的 。 如 果 应 用 程序 将 要 做 更 新 全 局 数据 结构 这 
样 的 事情 ， 同 时 要 捕 提 某 些 信号 ， 而 这 些 信 号 的 处 理 程序 又 会 引起 执行 sigsetjmp， 则 在 更 
新 这 种 数据 结构 时 要 阻塞 此 类 信号 。 










go EE gus : 
在 程序 清单 10-2 中 ， 信 号 处 理 程序 my_a1larm 调 用 不 可 重 入 函数 getpwnam， 而 


my_alarm 每 秒 钟 被 调用 一 次 。10.10 节 中 将 说 明 alarm 函 数 。 在 该 程序 中 调用 alarm 铺 数 使 得 
每 秒 产 生 一 次 SIGALRM 信 号 。 


程序 清单 10-2 在 信号 处 理 程序 中 调用 不 可 重 入 函数 


#include "apue.h" 
#include <pwd.h> 


static void 
my_alarm(int signo) 


struct passwd *rootptr; 


printf ("in signal handler\n") ; 

if ((rootptr = getpwnam("root")) == NULL) 
err sys("getpwnam(root) error"); 

alarm(1); 


} 
int 
main (void) 


struct passwd *ptr; 


Signal(SIGALRM, my alarm); 
alarm(1); 
for (; ; ) { 
if ((ptr = getpwnam("sar")) == NULL) 
err sys("getpwnam error"); 
if (strcmp(ptr-»pw name, "sar") != 0) 
printf ("return value corrupted!, pw name = %s\n", 
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ptr-»pw name); 





运行 该 程序 时 ， 其 结果 具有 随意 性 。 通 常 ， 在 信号 处 理 程序 经 多 次 迭代 返回 时 ， 该 程序 将 
由 SIGSEGV 信 号 终止 。 检 查 core 文 件 ， 从 中 可 以 看 到 main 函 数 已 调用 getpwnam， 而 且 当 信 
号 处 理 程序 调用 此 同一 函数 时 ， 某 些 内 部 指针 出 了 问题 。 偶 然 ， 此 程序 会 运行 若干 秒 ， 然 后 因 
产生 SITGSEGV 信 号 而 终止 。 在 捕捉 到 信号 后 ， 若 main 函 数 仍 正确 运行 ， 其 返回 值 却 有 时 错误 ， 
有 时 正确 。 有 一 次 在 Mac OS X 上 运行 该 程序 时 曾经 打印 出 来 自 mal loc 库 例 程 的 警告 信息 ， 声 
称 正 释放 的 指针 是 未 经 mal loc 分 配 的 。 

从 此 实例 中 可 以 看 出 ， 若 在 信号 处 理 程序 中 调用 一 个 不 可 重 入 函数 ， 则 其 结果 是 不 可 预 
见 的 。 m 


10.7 SIGCLDi£ Y. 


SIGCLD 和 SIGCHLD 这 两 个 信号 很 容易 被 混淆 。SIGCLD (没有 H) 是 系统 V 的 一 个 信号 名 ， 
其 语义 与 名 为 STGCHLD 的 BSD 信 号 不 同 。POSIX.1 则 采 用 BSD 的 STGCHLD 信 和 号。 

BSD 的 SIGCHLD 信号 语义 与 其 他 信号 的 语义 相 类 似 。 子 进程 状态 改变 后 产生 此 信忠 ， 父 进 
程 需 要 调用 一 个 wait 函 数 以 确定 发 生 了 什么 。 

由 于 历史 原因 ， 系 统 V 处 理 SIGCLD 信 号 的 方式 不 同 于 其 他 信号。 如 果 用 signal 或 
sigset (早期 设置 信号 配置 的 与 SRV3 兼 容 的 函数 ) 设置 信号 配置 ， 则 基于 SVR4 的 系统 继续 
了 这 一 具有 问题 色彩 的 传统 ( 即 兼容 性 限制 )。 对 于 SITGCLD 的 早期 处 理 方式 如 下 ， 

(1) 如 果 进 程 特 地 设置 该 信号 的 配置 为 SITG_IGN， 则 调用 进程 的 子 进程 将 不 产生 僵 死 进程 。 
注意 ， 这 与 其 默认 动作 (SIG_DFL) “忽略 ”( 见 图 10-1) 不 同 。 代 之 以 在 子 进程 终止 时 ， 将 其 
该 wait 会 返回 -1， 并 将 其 errno 设 置 为 EcCHILD (此 信号 的 默认 配置 是 忽略 ， 但 这 不 会 造成 上 
述 语义 起 作用 。 代 之 以 我 们 必须 特地 指定 其 配置 为 SIG_IGN)。 


POSIX.1 并 未 说 明 在 SIGCHLD 被 忽略 时 应 产生 的 后 果 、 所 以 这 种 运行 行为 是 允许 的 。Single UNIX 
Specification 包 括 了 一 个 XSI 扩 展 ， 它 规定 对 于 SIGCHLD 支 持 这 种 运行 行为 。 
如 果 SIGCHLD 被 忽略 ，4.4BSD 总 是 产生 伪 死 子 进程 。 如 果 要 如 免 僧 死 子 进程 ， 则 必须 等 待 子 进程 。 


FreeBSD 5.2.1 对 此 的 处 理 方式 与 4.4BSD 相 同 。 但 是 ，Mac OS X 10.3 在 SIGCHLD 被 忽略 时 ， 并 未 创建 全 
死 子 进程 。 


在 SVR4 中 ,如果 调用 signal 或 sigset 将 SIGCHLD 的 配置 设置 为 忽略 ， 则 决 不 会 产 生 僵 死 子 进程 。 
Linux 2.4.224eSolaris 9 在 此 方面 追随 SVR4。 


使 用 sigaction 可 设置 SA_NOCLDWAIT 标 志 ( 见 表 10-5) 以 避免 子 进程 信 死 。 本 书 讨论 的 四 种 平 
台 都 支持 这 一 动作 。 


(2) 如 果 将 STGCLD 的 配置 设置 为 捕捉 ， 则 内 核 立即 检查 是 否 有 子 进程 准备 好 被 等 待 ， 如 果 


是 这 样 ， 则 调用 SIGCLD 处 理 程 序 。 
第 (2) 项 改变 了 为 此 信号 编写 处 理 程序 的 方法 。 这 一 点 可 在 下 面 的 实例 中 看 到 。 


实 例 


10.4 市 曾 提 到 进入 信号 处 理 程序 后 ， 首 先 要 调用 signal 函 数 以 重新 设置 此 信号 处 理 程序 
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(在 信号 被 复位 回 其 默认 值 时 ， 它 可 能 被 委 失 ， 立 即 重新 设置 可 以 减少 此 窗口 时 间 )。 程 序 清单 
10-3 显 示 了 这 一 点 。 但 此 程序 不 能 在 某 些 平台 上 正常 工作 。 如 果 在 传统 的 系统 V 平 台 (例如 
OpenServer 5 或 UnixWare 7) 上 编译 并 运行 此 程序 ， 则 其 输出 是 一 行 行 地 不 断 重复 “SIGCLD 
received”。 最 后 进程 用 完 其 栈 空间 并 异常 终止 。 


程序 清单 10-3 不 能 正常 工作 的 系统 V sSIGCLD 处 理 程 序 


#include "apue.h" 
#include «sys/wait.h» 


static void sig cld(int); 


int 
main() 
{ 
pidit pid; 
if (signal(SIGCLD, sig cld) == SIG ERR) 


perror ("signal error"); 
if ((pid = fork()) < 0) { 
perror ("fork error"); 


} else if (pid == 0) { /* child */ 
sleep(2); 
_exit (0); 

} 

pause () ; /* parent */ 

exit (0); 


} 

static void 

Sig cld(int signo) /* interrupts pause() */ 
pid t pid; 
int status; 


printf ("SIGCLD received\n") ; 


if (signal (SIGCLD, sig_cld) == SIG ERR) /* reestablish handler */ 
perror ("signal error"); 
if ((pid = wait(&status)) < 0) /* fetch child status */ 


perror ("wait error"); 
printf ("pid = %d\n", pid); 
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因为 基于 BSD 的 系统 通常 并 不 支持 早期 系统 V SIGCLD 的 语义 ， 所 以 FreeBSD 5.2.1 和 Mac OS X 
10.3 并 没有 出 现 此 问题 。Linux 2.4.22 也 没有 出 现 此 问题 ， 其 原因 是 虽然 SIGCLD 和 STGCHLD 定 义 为 同 
一 值 ， 但 当 一 进程 安排 捕捉 SIGCHLD， 并 且 已 经 有 进程 准备 好 由 其 父 进程 等 待 时 ， 该 系统 并 不 调用 
SIGCHLD 信 号 的 处 理 程序 。 另 一 方面 ，Solaris 9 在 此 种 情况 确实 调用 该 信号 处 理 程 序 ， 但 在 内 核 中 增加 
了 避免 此 问题 的 代码 。 

虽然 本 书 说 明 的 所 有 四 种 平台 都 解决 了 这 一 问题 ， 但 是 应 当 理 解 没有 解决 这 一 问题 的 平台 (例如 
UnixWare) 依然 存在 。 


此 程序 的 问题 是 : 在 信号 处 理 程序 的 开始 处 调用 signal ， 按 照 上 述 第 2 项 ， 内 核 检 查 是 否 
有 需要 等 待 的 子 进程 《因为 我 们 正在 处 理 一 个 SIGCLD， 所 以 确实 有 这 种 子 进程 )， 所 以 它 产生 
另 一 个 对 信号 处 理 程序 的 调用 。 信 号 处 理 程序 调用 signal ， 整 个 过 程 再 次 重复 。 

为 了 解决 这 一 问题 ， 应 当 在 调用 wait 取 到 子 进程 的 终止 状态 后 再 调用 signal。 此 时 仅 当 
其 他 子 进程 终止 时 ， 内 核 才 会 再 次 产生 此 种 信号 。 
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如 果 为 SIGCHLD 建 立 了 一 个 信号 处 理 程序 . 又 存在 一 个 已 终止 但 父 进程 尚未 等 待 它 的 进程 ， 则 且 
否 会 产生 信号 ? POSIX.1 对 此 没有 作 说 明 。 这 样 就 允许 前 面 所 述 的 工作 方式 。 但 是 ，POSIX.1 在 信号 发 
生 时 并 没有 将 信号 配置 复位 为 其 默认 值 (假定 正 调用 POSIX.1 的 sigaction 函 数 设 置 其 配置 )， 于 是 在 
SIGCHLD 处 理 程序 中 也 就 不 必 再 为 该 信号 建立 一 个 信号 处 理 程序 。 口 


务必 了 解 你 所 用 的 系统 中 SIGCHLD 信 号 的 语义 。 也 应 了 解 在 某 些 系统 中 #define 
SIGCHLD 为 SIGCLD 或 反之 。 更 改 这 种 信号 的 名 字 使 你 可 以 编译 为 另 一 个 系统 编写 的 程序 ， 但 
是 如 果 这 一 程序 使 用 该 信号 的 另 一 种 语义 ， 则 这 样 的 程序 也 不 能 工作 。 


在 本 书 说 明 的 四 种 平台 上 ，SIGCLD 等 价 于 SIGCHLD。 


10.8 可 靠 信号 术语 和 语义 


人 
程 产生 一 个 信号 (或 向 进程 发 送 一 个 信号 )。 事 件 可 以 是 硬件 异常 (例如 ， 除 以 0)、 软 件 条 件 
c ae 终端 产生 的 信号 或 调用 ki11 函 数 。 在 产生 了 信号 时 ， 内 核 通 常 
在 进程 表 中 设置 一 个 某 种 形式 的 标志 。 

当 对 信号 采取 了 这 种 动作 时 ， 我 们 说 向 进程 递送 了 一 个 信号 。 在 信号 产生 (generation) 和 
递送 (delivery) 之 间 的 时 间 间 隔 内 ， 称 信号 是 未 决 的 (pending)。 

进程 可 以 选用 信号 递送 阻塞 。 如 果 为 进程 产生 了 一 个 选择 为 阻塞 的 信号 ， 而 且 对 该 信号 的 
动作 是 系统 默认 动作 或 捕 所 该 信号 ， 则 为 该 进程 将 此 信号 保持 为 未 决 状态 ， 直 到 该 进程 (a) 对 
此 信号 解除 了 阻塞 ， 或 者 (b) 将 对 此 信号 的 动作 更 改 为 忽略 。 内 核 在 递送 一 个 原来 被 阻塞 的 信 
号 给 进程 时 (而 不 是 在 产生 该 信号 时 ) ， 才 决定 对 它 的 处 理 方式 。 于 是 进程 在 信号 递送 给 它 之 
前 仍 可 改变 对 该 信号 的 动作 。 进 程 调用 sigpendqing 国 数 ( 见 10.13 节 ) 来 判定 哪些 信号 是 设置 
为 阻塞 并 处 于 未 决 状态 的 。 

如 果 在 进程 解除 对 某 个 信号 的 阻塞 之 前 ， 这 种 信号 发 生 了 多 次 ， 那 么 将 如 何 呢 ? POSIX. fè 
许 系统 递送 该 信号 一 次 或 多 次 。 如 果 递 送 该 信号 多 次 ， 则 称 对 这 些 信号 进行 了 排队 。 但 是 除非 支 
持 POSIX.1 实 时 扩展 ， 否 则 大 多 数 UNIX 并 不 对 信号 排队 。 代 之 以 UNIX 内 核 只 递送 这 种 信号 一 次 。 


SVR2 的 手册 页 称 ， 在 进程 执行 SIGCLD 信 号 处 理 程序 期 间 。 该 信号 是 用 排队 方式 处 理 的 ， 虽 然 在 
概念 层次 上 这 可 能 是 真 的 ， 但 实际 并 非 如 此 。 代 之 以 ， 内 核 按 10.7 节 中 所 述 方式 产生 此 信号 。SVR3 的 
手册 页 对 此 做 了 修改 ， 它 指明 在 进程 执行 SIGCLD 信 号 处 理 程序 期 间 ， 忽 略 STIGCLD 信 号 。SVR4 手 册页 
删除 了 有 关 部 分 ， 也 就 是 说 ， 在 进程 执行 SIGCLD 信 号 处 理 程序 期 间 ， 如 若 又 产生 了 SIGCLD 信 号 ， 
SVR4 手 册页 对 此 未 作 任何 说 明 。 

AT&T[1990e] 中 的 SVR4 sigaction(2) 手 册页 称 SA_SIGINFO 标 志 ( 见 图 10-16) 使 信号 可 靠 地 排 
队 ， 这 也 不 正确 。 表 面 上 内 核 部 分 地 实现 了 此 功能 ， 但 在 SVR4 中 并 不 起 作用 。 今 人 不 可 思议 的 是 ， 
SVIDz] 4T dt EB. P] 3E A ME] E63 A A, 


如 果 有 多 个 信号 要 递送 给 一 个 进程 ， 那 么 将 如 何 呢 ? POSIX.1 并 没有 规定 这 些 信号 的 递送 
顺序 。 但 是 POSIX.1 的 Rationale 建 议 : 在 其 他 信号 之 前 递送 与 进程 当前 状态 有 关 的 信号 ， 例 如 
SIGSEGV。 

每 个 进程 都 有 一 个 信号 屏蔽 字 (signal mask)， 它 规定 了 当前 要 阻塞 递送 到 该 进程 的 信号 集 。 
对 于 每 种 可 能 的 信号 ， 该 屏蔽 字 中 都 有 一 位 与 之 对 应 。 对 于 某 种 信号 ， 若 其 对 应 位 已 设置 ， 则 
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它 当前 是 被 阻塞 的 。 进 程 可 以 调用 sigprocmask (在 10.12 节 中 说 明 ) 来 检测 和 更 改 其 当前 信 
号 屏蔽 字 。 

言 号 数量 可 能 会 超过 整 型 所 包含 的 二 进 制 位 数 ， 因 此 POSIX.1 定 义 了 一 个 新 数据 类 型 
sigset_t， 用 于 保存 一 个 信号 集 。 例 如 ， 信 号 屏蔽 字 就 存放 在 这 些 信号 集 的 一 个 中 。10.11 节 
将 说 明 对 信号 集 进 行 操作 的 5 个 函数 。 


10.9 killf#fraiseRR 
ki1ll1 函 数 将 信号 发 送 给 进程 或 进程 组 。rai se 函数 则 允许 进程 向 自身 发 送信 和 号。 


raise 原 来 是 由 1SO C 定 义 的 。 后 来 ， 为 了 与 ISO C 标 准 保持 一 致 ， POSIX.1 也 包括 了 该 函数 。 但 
是 POSIX.1 扩 展 了 raise 的 规范 ， 使 其 可 处 理 线程 〈12.8 节 中 讨论 线程 如 何 与 信号 交互 ) 。 因 为 ITSO CHR 
涉及 多 进程 ， 所 以 它 不 能 定义 如 kill 这样 要 有 一 个 进程 ID 作为 其 参数 的 函数 。 311 


#include <signal.h> 


int kill(pid t pid, int signo); 


int raise(int signo); 





两 个 函数 返回 值 : 若 成 功 则 返回 0， 若 出 错 则 返回 -1 


调用 
raise (signo) ; 
等 价 于 调用 
kill(getpid(), signo); 
kil11 的 pid 参 数 有 4 种 不 同 的 情况 : 
pid>0 将 该 信号 发 送 给 进程 了 为 pid 的 进程 。 
pid==0 将 该 信号 发 送 给 与 发 送 进程 属于 同一 进程 组 的 所 有 进程 (这些 进程 的 进程 组 ID 
等 于 发 送 进程 的 进程 组 ID)， 而 且 发 送 进程 具有 向 这 些 进 程 发 送信 号 的 权限 。 
注意 ， 这 里 用 的 术语 “所 有 进程 ”不 包括 实现 定义 的 系统 进程 集 。 对 于 大 多 数 
UNIX 系 统 ， 系 统 进程 集 包 括 内 核 进程 以 及 init (pid 1)。 

pid<0 将 该 信号 发 送 给 其 进程 组 ID 等 于 pid 的 绝对 值 ， 而 且 发 送 进程 具有 向 其 发 送信 号 
的 权限 。 如 上 所 述 ,“ 所 有 进程 集 ” 并 不 包括 某 些 系统 进程 。 

Pid == 一 1 将 该 信号 发 送 给 发 送 进程 有 权限 向 它们 发 送信 号 的 系统 上 的 所 有 进程 。 如 上 所 
述 ,“ 进 程 集 ”不 包括 某 些 系统 进程 。 

上 面 曾 提 及 ， 进 程 将 信号 发 送 给 其 他 进程 需要 权限 。 超 级 用 户 可 将 信号 发 送 给 任 一 进程 。 
对 于 非 超级 用 户 ， 其 基本 规则 是 发 送 者 的 实际 或 有 效用 户 ID 必须 等 于 接收 者 的 实际 或 有 效用 户 
ID。 如 果实 现 支 持 _POSIX_SAVED_IDS (如 POSIX.1 现 在 要 求 的 那样 ) ， 则 检查 接收 者 的 保存 
的 设置 用 户 ID (而 不 是 其 有 效用 户 ID)。 在 对 权限 进行 测试 时 也 有 一 个 特例 : 如 果 被 发 送 的 信 
号 是 SIGCONT， 则 进程 可 将 它 发 送 给 属于 同一 会 话 的 任何 其 他 进程 。 

POSIX.1 将 编号 为 0 的 信号 定义 为 空 信 号 。 如 果 signo 参 数 是 0， 则 ki11 仍 执行 正常 的 错误 检 
得 ， 但 不 发 送信 号 。 这 常 被 用 来 确定 一 个 特定 进程 是 否 仍旧 存在 。 如 果 向 一 个 并 不 存在 的 进程 
发 送 空 信号 ， 则 ki1l1 返 回 -1， 并 将 errno 设 置 为 ESRCH。 但 是 ， 应 当 了 解 ，UNIX 系 统 在 经 过 
一 段 时 间 后 会 重新 使 用 进程 ID， 所 以 一 个 现 有 的 具有 所 给 定 进程 ID 的 进程 并 不 一 定 就 是 你 想 要 
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的 进程 。 

还 应 理解 的 是 ， 对 于 进程 是 否 存在 的 这 种 测试 不 是 原子 操作 。 在 ki11 向 调用 者 返回 测试 
结果 时 ， 原 来 存在 的 被 测试 进程 此 时 可 能 已 经 终止 ， 所 以 这 种 测试 并 无 多 大 价值 。 

如 果 调 用 ki11 为 调用 进程 产生 信号 ， 而 且 此 信号 是 不 被 阻塞 的 ， 那 么 在 ki11 返 回 之 前 ， 
就 会 将 signo 或 者 某 个 其 他 未 决 的 非 阻塞 信号 传送 至 该 进程 。( 对 于 线程 而 言 ， 还 有 一 些 附加 条 
fFe 详细 情况 见 12.8 节 。) 


10.10 alarm 和 pause 函 数 


使 用 alazm 国 数 可 以 设置 一 个 计时 器 ， 在 将 来 某 个 指定 的 时 间 该 计时 器 会 超时 。 当 计时 器 
超时 时 ， 产 生 SIGALRM 信 号 。 如 果 不 忽略 或 不 捕捉 此 信号 ， 则 其 默认 动作 是 终止 调用 该 alarm 
函数 的 进程 。 


#include <unistd.h> 


unsigned int alarm(unsigned int seconds) ; 


返回 值 : 0 或 以 前 设置 的 闹钟 时 间 的 余 留 秒 数 


其 中 ,参数 seconds 的 值 是 秒 数 ， 经 过 了 指定 的 seconds 秒 后 会 产生 信号 SIGALRM。 要 了 解 
的 是 ， 经 过 了 指定 的 秒 数 后 ， 信 号 由 内 核 产 生 ， 由 于 进程 调度 的 延迟 ， 所 以 进程 得 到 控制 从 而 
能 够 处 理 该 信号 还 需 一 些 时 间 。 


早期 的 UNIX 系 统 实现 曾 提 出 警告 ， 这 科 信 号 可 能 比 预定 值 提前 1 秒 发 送 。POSIX.1 则 不 允许 这 样 做 。 


每 个 进程 只 能 有 一 个 闹钟 时 钟 。 如 果 在 调用 alarm 时 ， 以 前 已 为 该 进程 设置 过 闹钟 时 钟 ， 
而 且 它 还 没有 超时 ， 则 将 该 闹钟 时 钟 的 余 留 值 作为 本 次 alarm 函 数 调用 的 值 返回 。 以 前 登记 的 
曾 钟 时 钟 则 被 新 值 代替 。 

如 果 有 以 前 为 进程 登记 的 尚未 超过 的 闸 钟 时 钟 ， 而 且 本 次 调用 的 seconds 值 是 0， 则 取消 以 
前 的 闹钟 时 钟 ， 其 余 留 值 仍 作 为 a1arm 函 数 的 返回 值 。 

虽然 SIGALRM 的 默认 动作 是 终止 进程 ， 但 是 大 多 数 使 用 闹钟 的 进程 会 捕捉 此 信号 。 如 果 此 
时 进程 要 终止 ， 则 在 终止 之 前 它 可 以 执行 所 需 的 清理 操作 。 如 果 我 们 想 捕捉 SIGALRM 信 号 ， 则 
必须 在 调用 alazrm 之 前 设置 该 信号 的 处 理 程序 。 如 果 我 们 先 调用 alarm， 然 后 在 我 们 能 够 设置 
SIGALRM 处 理 程序 之 前 已 接收 到 该 信号 ， 那 么 进程 将 终止 。 

pause 畏 数 使 调用 进程 挂 起 直至 捕捉 到 一 个 信和 号。 





#include <unistd.h> 


int pause (void); 





返回 值 : -1， 并 将 errno 设 置 为 EINTR 


只 有 执行 了 一 个 信号 处 理 程序 并 从 其 返回 时 ，pause 才 返回 。 在 这 种 情况 下 ，pause 返 
回 --1， 并 将 errno 设 置 为 EINTR。 


实例 
使 用 alarm 和 pause， 进 程 可 使 自己 休眠 一 段 指定 的 时 间 。 程 序 清单 10-4 中 的 sleep1 国 
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数 提供 这 种 功能 (但 是 它 有 一 些 问题 ， 我 们 很 快 就 会 看 到 ) 。 
程序 清单 10-4 sleep 的 简单 而 不 完整 的 实现 


#include <signal .h> 
#include <unistd.h> 


static void 
sig_alrm(int signo) 


/* nothing to do, just return to wake up the pause */ 


} 


unsigned int 
sleep1 (unsigned int nsecs) 


{ 


if (signal (SIGALRM, sig alrm) == SIG ERR) 
return (nsecs); 
alarm(nsecs); /* start the timer */ 
pause(); /* next caught signàl wakes us up */ 
return(alarm(0)); /* turn off timer, return unslept time */ 


) 


程序 中 的 sleep1 函 数 看 起 来 与 将 在 10.19 节 中 说 明 的 sleep 函 数 类 似 ， 但 这 种 简单 实现 有 


下 列 三 个 问题 : 

(1) 如 果 在 调用 sleep1l 之 前 ， 调 用 者 已 设置 了 闹钟 ， 则 它 会 被 sleep1 函数 中 的 第 一 次 
alarm 调 用 擦 除 。 可 用 下 列 方法 更 正 这 一 点 ， 检查 第 一 次 调用 alarm 的 返回 值 ， 如 其 小 于 本 次 调 
用 alarm 的 参数 值 ， 则 只 应 等 到 上 次 设置 的 闹钟 超时 。 如 果 上 次 设置 闹钟 的 超时 时 间 晚 于 本 次 设 
置 值 ， 则 在 sleep1 函 数 返 回 之 前 ， 复 位 此 益 钟 ， 使 其 在 上 次 闹钟 的 设 定 时 间 再 次 发 生 超时 。 

(2) 该 程序 中 修改 了 对 SIGALRM 的 配置 。 如 果 编 写 了 一 个 函数 供 其 他 函数 调用 ， 则 在 该 函 
数 被 调用 时 先 要 保存 原配 置 ， 在 该 函数 返回 前 再 恢复 原配 置 。 更 正 这 一 点 的 方法 是 ; 保存 
signal 尔 数 的 返回 值 ， 在 返回 前 复位 原配 置 。 

(3) 在 第 一 次 调用 alarm 和 调用 pause 之 间 有 一 个 竞争 条 件 。 在 一 个 繁忙 的 系统 中 ， 可 能 
alarm 在 调用 pause 之 前 超时 ， 并 调用 了 信号 处 理 程序 。 如 果 发 生 这 种 情况 ， 则 在 调用 pause 
后 ， 如 果 没 有 捕捉 到 其 他 信号 ， 则 调用 者 将 永远 被 挂 起 。 

sleep 的 早期 实现 与 程序 清单 10-4 类 似 ， 但 更 正 了 问题 (1) 和 (2)。 有 两 种 方法 可 以 更 正 问 题 
(3)。 第 一 种 方法 是 使 用 s et jmp ， 下 一 个 实例 将 说 明 这 种 方法 。 另 一 种 方法 是 使 用 
sigprocmask 和 sigsuspend，10.19 节 将 说 明 这 种 方法 。 口 








SVR2 中 的 sleep 实 现 使 用 了 setjmp 和 longjmp ( 见 7.10 节 ) ， 以 避免 前 一 个 实例 问题 (3) 
中 所 说 明 的 竞争 条 件 。 此 函数 的 一 个 简单 版 本 称 为 sl eep2 ， 示 于 程序 清单 10-5 中 (为 了 缩短 
实例 长 度 ， 程 序 中 没有 处 理 上 面 所 说 的 问题 (1) 和 (2))。 


程序 清单 10-5 sleep 的 另 一 个 (不 完善 ) 实现 


#include <setjmp.h> 
#include <signal .h> 
#include <unistd.h> 


static jmp buf env_alrm; 
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static void 
sig alrm(int signo) 


longjmp(env alrm, 1); 


unsigned int 
Sleep2 (unsigned int nsecs) 





if (signal(SIGALRM, sig alrm) -- SIG ERR) 


return (nsecs) ; 


if (setjmp(env_alrm) == 0) { 


alarm (nsecs) ; 
pause (); 


return (alarm(0)); 


/* start the timer */ 
/* next caught signal wakes us up */ 


/* turn off timer, return unslept time */ 


} 


在 此 函数 中 ， 程 序 清 单 10-4 具 有 的 竞争 条 件 已 被 避免 。 即 使 pause 从 未 执行 ， 
SIGALRM hf, sleep HAEA E., 

但 是 ，sleep2 函 数 中 却 有 另 一 个 难以 察觉 的 问题 ， 它 涉及 与 其 他 信号 的 交互 。 如 果 
SITGALRM 中 断 了 某 个 其 他 信号 处 理 程序 ， 则 调用 1ongjmp 会 提早 终止 该 信号 处 理 程序 。 程 序 
清单 10-6 显 示 了 这 种 情况 。SIGINT 处 理 程序 中 包含 了 for 循 环 语句 ， 它 在 作者 所 用 系统 上 的 执 
行 时 间 超 过 5 秒 钟 ， 也 就 是 大 于 sleep2 的 参数 值 ， 这 正 是 我 们 想 要 的 。 将 整 型 变量 kx 声 明 为 
volatile， 这 样 就 阻止 了 优化 编译 器 丢弃 循环 语句 。 执 行程 序 清单 10-6 得 到 ; 


$ ./a.out 
^? 我 们 键入 中 断 字 符 


Sig int starting 
Sleep2 returned: 0 


从 中 可 见 sleep2 函 数 所 引起 的 1ongjmp 使 另 一 个 信和 号 处 理 程 序 sig_int 提 早 终止 ， 即 使 它 未 

完成 也 会 如 此 。 如 果 将 SVR2 的 sleep 函 数 与 其 他 信号 处 理 程序 一 起 使 用 ， 就 可 能 碰 到 这 种 情 

况 。 见 习题 10.3。 口 
程序 清单 10-6 在 一 个 捕捉 其 他 信号 的 程序 中 调用 sleep2 


#include "apue .hr 





在 发 生 


sleep2 (unsigned int); 
Sig int(int); 


unsigned int 
Static void 
int 

main (void) 


unsigned int unslept; 

if (signal(SIGINT, sig int) == SIG ERR) 
err_sys ("signal (SIGINT) error"); 

unslept = sleep2(5); 

printf("sleep2 returned: %u\n", unslept) ; 

exit (0); 


} 


static void 
sig_int (int signo) 


int i; j: 
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volatile int k; 
/* 
* Tune these loops to run for more than 5 seconds 
* on whatever System this test program is run. 
*/ 
printf ("\nsig_int starting An"); 
for (i = 0; i < 300000; i++) 
for (j = 0; j < 4000; j++) 
k += i * j; 
printf("sig int finished\n"); 


) 


有 关 sleepl 和 sleep2 函 数 的 这 两 个 实例 的 目的 是 告诉 我 们 在 涉及 信号 时 需要 有 和 精细 而 周 
到 的 考虑 。 下 面 几 节 将 说 明 解 决 这 些 问 题 的 方法 ， 使 我 们 能 够 可 靠 地 、 在 不 影响 其 他 代码 段 的 
情况 下 处 理 信 号 。 












D s 


除了 用 来 实现 sleep 函 数 外 ，alarm 还 常用 于 对 可 能 阻塞 的 操作 设置 时 间 上 限 值 。 例 如 ， 程 
序 中 有 一 个 读 低速 设备 的 可 能 阻塞 的 操作 ( 见 10.5 节 ) ， 我 们 希望 超过 一 定时 间 量 后 就 停止 执行 
该 操作 。 程 序 清单 10-7 实 现 了 这 一 点 ， 它 从 标准 输入 读 一 行 ， 然 后 将 其 写 到 标准 输出 上 。 


程序 清单 10-7 具有 超时 限制 的 read 调 用 
#include "apue.h" 
static void sig alrm(int); 
int 
main(void) 
int n; 
char line [MAXLINE] ; 


if (signal (SIGALRM, sig alrm) == SIG ERR) 
err sys ("signal (SIGALRM) error"); 


alarm(10) ; 

if ((n = read(STDIN_FILENO, line, MAXLINE)) < 0) 
err_sys ("read error"); 

alarm(0); 


write(STDOUT FILENO, line, n); 
exit(0); 


) 


Static void 
Sig alrm(int signo) 


/* nothing to do, just return to interrupt the read */ 


) 


这 种 代码 序列 在 很 多 UNIX 应 用 程序 中 都 能 见 到 ， 但 是 这 种 程序 有 两 个 问题 : 

(1) 程序 清单 10-7 具 有 与 程序 清单 10-4 相 同 的 问题 ， 在 第 一 次 alarm 调 用 和 reaa 调 用 之 间 
有 一 个 竞争 条 件 。 如 果 内 核 在 这 两 个 函数 调用 之 间 使 进程 阻塞 ,而 其 时 间 长 度 又 超过 闸 钟 时 间 ， 
则 read 可 能 永远 阻塞 。 大 多 数 这 种 类 型 的 操作 使 用 较 长 的 闹钟 时 间 ， 例 如 1 分 钟 或 更 长 一 点 ， 
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使 这 种 问题 不 会 发 生 ， 但 无 论 如 何 这 是 一 个 竞争 条 件 。 

(2) 如 果 系 统 调用 是 自动 重启 动 的 ， 则 当 从 sIGALRM 信 号 处 理 程序 返回 时 ，read 并 不 被 中 
断 。 在 这 种 情形 下 ， 设 置 时 间 限 制 不 起 作用 。 

在 这 里 我 们 确实 需要 中 断 低速 系统 调用 。POSIX.1 并 未 提供 一 种 可 移植 的 方法 来 实现 这 一 
M, HÆ, Single UNIX Specification 的 XSI 扩 展 却 做 到 了 这 一 点 。 我 们 将 在 10.14 节 对 此 进行 详 
细 讨 论 。 口 





让 我 们 用 longjmp 重 新 实现 前 面 的 实例 ( 见 程序 清单 10-8) 。 使 用 这 种 方法 则 无 需 担心 一 
个 慢 速 的 系统 调用 是 否 被 中 断 。 
程序 清单 10-8 使 用 longjmp ， 带 超时 限制 调用 read 


#include "apue.h" 
#include «setjmp.h» 


static void sig alrm(int); 
static jmp buf env alrm; 

int 

main(void) 


int n; 
char line [MAXLINE] ; 


if (signal (SIGALRM, sig alrm) == SIG ERR) 
err_sys ("signal (SIGALRM) error"); 
if (setjmp(env_alrm) != 0) 


err quit ("read timeout"); 


alarm(10) ; 

if ((n = read(STDIN FILENO, line, MAXLINE)) « 0) 
err SysS("read error"); 

alarm(0); 


write(STDOUT FILENO, line, n); 
exit (0); 


) 


Static void 
Sig alrm(int signo) 


longjmp(env alrm, 1); 





不 管 系统 是 否 重新 启动 中 断 的 系统 调用 ， 该 程序 都 会 如 所 预期 的 那样 工作 。 但 是 要 知道 ， 
该 程序 仍 肯 有 和 程序 清单 10-5 中 相同 的 与 其 他 信号 处 理 程序 交互 的 问题 。 口 


如 果 要 对 VO 操作 设置 时 间 限制 ， 则 如 上 所 示 可 以 使 用 1ongjmp， 当 然 也 要 清楚 它 可 能 有 
与 其 他 信号 处 理 程 序 交互 的 问题 。 另 一 种 选择 是 使 用 select 或 bol1 函 数 ，14.5.1 节 和 14.5.2 节 
将 对 它们 进行 说 明 。 


10.11 信和 号 集 
我 们 需要 有 一 个 能 表示 多 个 信号 一 一 信号 集 (signal set) 的 数据 类 型 。 我 们 将 在 诸如 
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sigprocmask (下 一 节 中 说 明 ) 之 类 的 函数 中 使 用 这 种 数据 类 型 ， 以 便 告 诉 内 核 不 允许 发 生 
该 信号 集中 的 信号 。 如 前 所 述 ， 信 号 种 类 数目 可 能 超过 一 个 整 型 量 所 包含 的 位 数 ， 所 以 一 般 而 
言 ， 不 能 用 整 型 量 中 的 一 位 代表 一 种 信号 ， 也 就 是 不 能 用 一 个 整 型 量 表示 信号 集 。POSIX.! 定 
义 了 数据 类 型 sigset_t 以 包含 一 个 信号 集 ， 并 且 定义 了 下 列 五 个 处 理 信号 集 的 函数 。 
#include «signal.h» 

sigemptyset (sigset_t *set) ; 

sigfillset(sigset t *set) ; 

sigaddset (sigset_t *set, int signo); 

sigdelset (sigset_t *set, int signo); 


四 个 函数 的 返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 -1 


sigismember (const sigset t *set, int signo); 


返回 值 : 车 真 则 返回 1， 若 假 则 返回 0， 若 出 错 则 返回 -1 





函数 sigemptyset 初 始 化 由 set 指 向 的 信号 集 ， 清 除 其 中 所 有 信号 。 国 数 sigfi11set 初 
始 化 由 set 指 向 的 信号 集 ， 使 其 包括 所 有 信号 。 所 有 应 用 程序 在 使 用 信号 集 前 ， 要 对 该 信号 集 调 
用 sigemptyset 或 sigfillset 一 次 。 这 是 因为 C 编 译 器 将 把 未 赋 初 值 的 外 部 和 静态 变量 都 
初始 化 为 0， 而 这 是 否 与 给 定 系 统 上 信号 集 的 实现 相对 应 却 并 不 清楚 。 

一 旦 已 经 初始 化 了 一 个 信号 集 ， 以 后 就 可 在 该 信号 集中 增 、 删 特定 的 信和 号。 函数 sigaddset 
将 一 个 信号 添加 到 现 有 集中 ，sigdelset 则 从 信号 集中 删除 一 个 信号 。 对 所 有 以 信号 集 作为 参数 
的 函数 ， 我 们 总 是 以 信号 集 地 址 作为 向 其 传送 的 参数 。 





如 果实 现 的 信号 数目 少 于 一 个 整 型 量 所 包含 的 位 数 ， 则 可 用 一 位 代表 一 个 信和 号 的 方法 实现 
信号 集 。 例 如 ， 在 本 书 的 后 续 部 分 ， 我 们 都 假定 一 种 实现 有 31 种 信号 和 32 位 整 型 量 。 
sigemptyset 函 数 将 整 型 量 设置 为 0，sigfillset 函 数 则 将 整 型 量 中 的 各 个 位 都 设置 为 1。 
这 两 个 函数 可 以 在 <signal .h> 头 文件 中 实现 为 宏 : 


#define sigemptyset (ptr) (* (ptr) 
#define sigfillset (ptr) (* (ptr) 


注意 ， 除 了 设置 信号 集中 各 位 为 1 外 ，sigfillset 必 须 返 回 9， 所 以 使 用 C 语 言 的 逗号 运算 符 ， 
它 将 逗号 运算 符 后 的 值 作为 表达 式 的 值 返回 。 

使 用 这 种 实现 ，sigadqdset 打 开 一 位 (将 该 位 设置 为 1) ，sigdelset 则 关闭 一 位 (将 该 
位 设置 为 0) ，sigismember 测 试 一 指定 位 。 因 为 没有 编号 为 0 的 信号 ， 所 以 从 信号 编号 中 减 去 


0) 
~(sigset_t)0, 0) 


1 以 得 到 要 处 理 位 的 位 编号 数 。 程 序 清单 10-9 实 现 了 这 些 函 数 。 319 
程序 清单 10-9 ”sigaddset 、sigdelset 和 sigismember 的 实现 
#include <signal .h> 
#include <errno.h> 


/* «signal.h» usually defines NSIG to include signal number 0 */ 
#define SIGBAD(signo) ( (signo) <= 0 || (signo) >= NSIG) 


int 
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sigaddset (sigset_t *set, int signo) 


if (SIGBAD(signo)) { errno = EINVAL; return(-1); } 


*set |= 1 << (signo - 1); /* turn bit on */ 
return(0); 


} 
int 
Sigdelset(sigset t *set, int signo) 


if (SIGBAD(signo)) { errno = EINVAL; return(-1); ) 


*set &- "(1 << (signo - 1)); /* turn bit off */ 
return(0); 

} 

int 

sigismember(const sigset_t *set, int signo) 


{ 


if (SIGBAD(signo)) { errno = EINVAL; return(-1); } 


return((*set & (1 << (signo - 1))) != 0); 


} 





也 可 将 这 三 个 函数 在 <signal .h> 中 实现 为 单行 宏 ， 但 是 POSIX.1 要 求 检查 信号 编号 参数 
的 有 效 性 ， 如 果 无 效 则 设置 errno。 在 宏 中 实现 这 一 点 比 在 函数 中 要 困难 。 


10.12 sigprocmaskt?m 


10.8 节 曾 提 及 一 个 进程 的 信号 屏蔽 字 规 定 了 当前 阻塞 而 不 能 递送 给 该 进程 的 信号 集 。 调 用 
图 数 sigprocmask 可 以 检测 或 更 改 其 信号 屏蔽 字 ， 或 者 在 一 个 步骤 中 同时 执行 这 两 个 操作 。 


#include «signal.h» 


int sigprocmask (int how, const sigset t *restrict set, 


sigset t *restrict oset); 


返回 值 : 若 成 功 则 返回 0， 若 出 错 则 返回 -1 


首先 ， 车 oset 是 非 空 指针 ， 那 么 进程 的 当前 信号 屏蔽 字 通 过 oset 返 回 。 

其 次 ， 若 set 是 一 个 非 空 指针 ， 则 参数 how 指 示 如 何 修 改 当 前 信号 屏 项 字 。 表 10-4 说 明了 how 
可 选用 的 值 。SIG_BLOCK 是 “或 ”操作 ， 而 SIG_SETMASK 则 是 赋值 操作 。 注 意 ， 不 能 阻塞 
SIGKILL 和 SIGSTOP 信 号 。 





表 10-4 用 sigprocmask 更 改 当前 信号 屏蔽 字 的 方法 


SIG_BLOCK 该 进程 新 的 信号 屏蔽 字 是 其 当前 信号 屏蔽 字 和 set 指 向 信号 集 的 
并 集 。set 包 含 了 我 们 希望 阻塞 的 附加 信号 


SIG_UNBLOCK 该 进程 新 的 信号 屏蔽 字 是 其 当前 信号 屏 项 字 和 set 所 指向 信号 集 
补 集 的 交集 。set 包 含 了 我 们 希望 解除 阻塞 的 信号 
SIG_SETMASK 该 进程 新 的 信号 屏蔽 字 将 被 se 指向 的 信号 集 的 值 代 替 





如 果 set 是 空 指针 ， 则 不 改变 该 进程 的 信号 屏 项 字 ，how 的 值 也 无 意义 。 
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在 调用 sigprocmask 后 如 果 有 任何 未 决 的 、 不 再 阻塞 的 信号 , 则 在 sigprocmask 返 回 前 ， 
至 少 会 将 其 中 一 个 信号 递送 给 该 进程 。 


sigprocmask 是 仅 为 单线 程 的 进程 定义 的 。 为 处 理 多 线程 的 进程 中 信号 的 屏 赴 ,提供 了 另 一 个 单 
独 的 函数 。 我 们 将 在 12.8 节 中 对 此 进行 讨论 。 


实 例 


程序 清单 10-10 显 示 了 一 个 函数 ， 它 打印 调用 进程 的 信号 屏蔽 字 中 信号 的 名 称 。 程 序 清 单 
10-14 和 程序 清单 10-15 将 调用 此 函数 。 
程序 清单 10-10 为 进程 打印 信号 屏蔽 字 


#include "apue .hn 
#include <errno.h> 


void 
pr_mask(const char *str) 
{ 
sigset_t sigset; 
int ermo_save; 
errno_save = errno; /* we can be called by signal handlers */ 


if (sigprocmask(0, NULL, &sigset) < 0) 
err sys("sigprocmask error"); 


printf ("%s", str); 321 


if (sigismember (&sigset, SIGINT)) printf ("SIGINT "); 
if (sigismember(&sigset, SIGQUIT))  printf("SIGQUIT "); 
if (sigismember(&sigset, SIGUSR1)) printf("SIGUSR1 "); 
if (sigismember(&sigset, SIGALRM))  printf("SIGALRM "); 


/* remaining signals can go here */ 


printf("in*); 
errno - errno save; 


} 
为 了 节省 空间 ， 没 有 对 表 10-1 中 列 出 的 每 一 种 信号 测试 该 屏蔽 字 (见习 题 10.9) 。 
10.13 sigpending 函 数 


sigpending 孙 数 返 回信 号 集 ， 其 中 的 各 个 信号 对 于 调用 进程 是 阻塞 的 而 不 能 递送 ， 因 而 
也 一 定 是 当前 未 决 的 。 该 信号 集 通过 set 参 数 返 回 。 


#include <signal.h> 


int sigpending(sigset t *set) ; 


返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 -1 





x 例 
程序 清单 10-11 使 用 了 很 多 前 面 说 明 过 的 信号 功能 。 
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程序 清单 10-11 信号 设置 和 sigprocmask 实 例 


#include "apue.h" 
Static void sig quit (int); 


int 
main (void) 


sigset t newmask, oldmask, pendmask; 


if (signal(SIGQUIT, sig quit) -- SIG ERR) 
err sys("can't catch SIGQUIT"); 


/* 

* Block SIGQUIT and save current signal mask. 
*/ 

sigemptyset (&newmask) ; 

sigaddset (&newmask, SIGQUIT) ; 


if (sigprocmask(SIG BLOCK, &newmask, &oldmask) < 0) 
err Sys("SIG BLOCK error"); 
Sleep(5); /* SIGQUIT here will remain pending */ 


if (sigpending(&pendmask) « 0) 
err Sys("sigpending error"); 
if (sigismember(&pendmask, SIGQUIT)) 
printf ("\nSIGQUIT pending\n") ; 
/* 
* Reset signal mask which unblocks SIGQUIT. 
*/ 
if (sigprocmask(SIG SETMASK, &oldmask, NULL) « 0) 
err sys("SIG SETMASK error"); 
printf("SIGQUIT unblocked\n") ; 


sleep (5); /* SIGQUIT here will terminate with core file */ 
exit (0); 


} 


static void 
sig quit(int signo) 


printf ("caught SIGQUIT An"); 
if (signal(SIGQUIT, SIG DFL) -- SIG ERR) 
err syS("can't reset SIGQUIT"); 
} 
= 


进程 阻塞 STGQUIT 信 号 ,保存 了 当前 信号 屏 项 字 (以 便 以 后 恢复 )， 然 后 休眠 5 秒 钟 。 在 此 
期 间 所 产生 的 退出 信号 STGQUIT 都 会 被 阻塞 ， 而 不 递送 至 该 进程 ， 直 到 该 信号 不 再 被 阻塞 ， 在 
5 秘 钟 休眠 结束 后 ， 检 查 该 信号 是 否 是 未 决 的 ， 然 后 将 SITGQUIT 设 置 为 不 再 阻塞 ， 

注意 ， 在 设置 SIGQUIT 为 阻塞 时 ， 我 们 保存 了 旧 屏 项 字 。 为 了 解除 对 该 信号 的 阻塞 ， 用 旧 
屏 茂 字 重 新 设置 了 进程 信号 屏蔽 字 (SIG SETMASK), 男 一 种 方法 是 用 SIG_UNBLOCK 使 阻塞 
的 信号 不 再 被 阻塞 。 但是， 应 当 了 解 如 果 编 写 一 个 可 能 由 其 他 人 使 用 的 函数 ， 而 且 需 要 在 函数 
中 阻塞 一 个 信号 ， 则 不 能 用 sIG_UNBLOCK 简 单 地 解除 对 此 信号 的 阻塞 ， 这 是 因为 此 函数 的 调 
用 者 在 调用 本 函数 之 前 可 能 也 阻塞 了 此 信和 号。 在 这 种 情况 下 必须 使 用 SIG_sETMASK 将 信号 屏 
蔽 字 复位 为 原先 值 ， 这 样 也 就 能 继续 阻塞 该 信号 。 10.18 节 的 system 函 数 部 分 有 这 样 一 个 例子 。 
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在 休眠 期 间 如 果 产 生 了 退出 信号 ， 那 么 此 时 该 信号 是 未 决 的 ， 但 是 不 再 受阻 塞 ， 所 以 在 
sigprocmask 返 回 之 前 ， 它 被 递送 到 调用 进程 。 从 程序 的 输出 中 可 以 看 出 : STGQUITT 处 理 程 
FF (sig quit) 中 的 printf 语 句 先 执行 ， 然 后 再 执行 sigprocmask 之 后 的 printf 语 句 。 

然后 该 进程 再 休眠 5 秒 钟 。 如 果 在 此 期 间 再 产生 退出 信号 ， 那 么 因为 在 上 次 捕捉 到 该 信号 
时 ， 已 将 其 处 理 方式 设置 为 默认 动作 ， 所 以 这 一 次 它 就 会 使 该 进程 终止 。 在 下 列 输出 中 ， 当 我 
们 在 终端 上 键入 退出 字符 Ctrl+\ 时 ， 终 端 打印 从 (终端 退出 字符 ) : 


$ ./a.out 

^N 产生 信号 一 次 (在 5 秒 钟 之 内 ) 
SIGQUIT pending 从 sleep 返 回 后 

Caught SIGQUIT 在 信号 处 理 程序 中 
SIGQUIT unblocked 从 sigprocmask 返 回 后 
“\Quit (coredump) 再 次 产生 信号 

$ ./a.out 

ion Won wie On O08 Win WE OR OR GR 产生 信号 10 次 〈 在 5 秒 钟 之 内 ) 
SIGQUIT pending 

caught SIGQUIT 只 产生 信号 一 次 

SIGQUIT unblocked 

“\Quit (coredump) 再 次 产生 信号 


在 shell 发 现 其 子 进程 异常 终止 时 ， 会 输出 “Quit (coredump)” 消 息 。 注意 ,第 二 次 运 
行 该 程序 时 , 在 进程 休眠 期 间 我 们 使 STGQUIT 信 号 产生 了 10 次 , 但 是 解除 了 对 该 信号 的 阻塞 后 ， 
只 会 向 进程 传送 一 次 STGQUIT。 从 中 可 以 看 出 在 此 系统 上 没有 对 信号 进行 排队 。 
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sigaction 函 数 的 功能 是 检查 或 修改 与 指定 信号 相关 联 的 处 理 动 作 (或 同时 执行 这 两 种 
操作 )。 此 函数 取代 了 UNIX 早 期 版 本 使 用 的 signal1 函 数 。 在 本 节 末 尾 用 sigaction 函 数 实现 
了 signal。 


#include «signal.h» 


int sigaction(int signo, const struct sigaction *restrict act, 


struct sigaction *restrict oact) ; 


返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 -1 


其 中 ， 参 数 signo 是 要 检测 或 修改 其 具体 动作 的 信号 编号 。 若 act 指 针 非 空 ， 则 要 修改 其 动 
作 。 如 果 oact 指 针 非 空 ， 则 系统 经 由 oact 指 针 返 回 该 信号 的 上 一 个 动作 。 此 函数 使 用 下 列 结构 : 


struct sigaction { 





void (*sa handler) (int); /* addr of signal handler, */ 

/* or SIG IGN, or SIG DFL */ 
sigset t sa mask; /* additional signals to block */ 
int sa flags; /* signal options, Figure 10.16 */ 
/* alternate handler */ 
void (*sa sigaction) (int, siginfo t *, void *); 


) 

当 更 改 信号 动作 时 ， 如 果 sa_hanalezr 字 段 包含 一 个 信号 捕捉 函数 的 地 址 (与 常量 
SIG_IGN 或 SIG_DFL 相 对 ), 则 sa_mask 字 段 说 明了 一 个 信号 集 , 在 调用 该 信号 捕捉 函数 之 前 ， 
这 一 信号 集 要 加 到 进程 的 信号 屏蔽 字 中 。 仅 当 从 信号 捕捉 函数 返回 时 再 将 进程 的 信号 屏蔽 字 复 
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位 为 原先 值 。 这 样 ， 在 调用 信和 号 处 理 程序 时 就 能 阻塞 某 些 信号 。 在 信和 号 处 理 程序 被 调用 时 ， 操 
作 系 统 建立 的 新 信号 屏蔽 字 包 括 正 被 递送 的 信号 。 因 此 保证 了 在 处 理 一 个 给 定 的 信号 时 ， 如 果 
这 种 信号 再 次 发 生 ， 那 么 它 会 被 阻塞 到 对 前 一 个 信号 的 处 理 结束 为 止 。 回 忆 10.8 节 ， 若 同一 种 
信号 多 次 发 生 ， 通 常 并 不 将 它们 排队 ， 所 以 如 果 在 某 种 信号 被 阻塞 时 它 发 生 了 五 次 ， 那 么 对 这 
种 信号 解除 阻塞 后 ， 其 信号 处 理 函 数 通常 只 会 被 调用 一 次 。 

一 旦 对 给 定 的 信号 设置 了 一 个 动作 ， 那 么 在 调用 sigaction 显 式 地 改变 它 之 前 ， 该 设置 
就 一 直 有 效 。 这 种 处 理 方 式 与 早期 的 不 可 靠 信 号 机 制 不 同 ， 而 符合 了 POSIX.1 在 这 方面 的 要 求 。 

act 结 构 的 sa_f1ags 字 段 指定 对 信号 进行 处 理 的 各 个 选项 。 表 10-5 详 细 列 出 了 这 些 选 项 的 
意义 。 若 该 标志 已 定义 在 基本 POSIX.1 标 准 中 ， 那 么 SUS 列 包含 *， 若 该 标志 定义 在 基本 
POSIX.1 标 准 的 XSI 扩 展 中 ， 那 么 该 列 包 含 XSI。 


表 10-5 ”处理 每 个 信号 的 选项 标志 (sa_flags) 


FreeBSD Linux MacOSX Solaris T 
SA INTERRUPT 由 此 信号 中 断 的 系统 调用 不 会 自动 重启 
aj (针对 sigaction 的 XSI 软 认 处 理 方 
式 )。 详 见 10.5 节 
SA_NOCLDSTOP . . 车 signo 是 SIGCHLD， 当 子 进程 停止 时 
(作业 控制 )， 不 产生 此 信号 。 当 子 进程 终 
止 时 ， 仍 但 产生 此 入 号 (但 请 参阅 下 面 说 
明 的 SA_NOCLDWAIT 选 项 )。 若 已 设置 此 
示 志 ， 则 当 停 止 的 进程 继续 运行 时 ， 作 为 
XSI 扩 展 ， 不 发 送 SIGCHLD 信 和 号 
SA_NOCLDWAIT e . 若 signo 是 SIGCHLD， 则 当 调 用 进程 的 子 
进程 终止 时 ， 不 创建 僵 死 进程 。 若 调用 进 
程 在 后 面 调用 wair， 则 调用 进程 阻塞 ， 直 
到 其 所 有 子 进程 都 终止 ， 此 时 返回 -1， 并 
将 errno 设 置 为 BCHILD ( 见 10.7 节 ) 
SA_NODEFER . . 当 捕捉 到 此 信号 时 ， 在 执行 其 信号 捕捉 
函数 时 ， 系 统 不 自动 阻塞 此 信号 (除非 
sa_mask 包 括 了 此 信号 ) 。 注 意 ， 此 种 类 
型 的 操作 对 应 于 早期 的 不 可 靠 信号 
SA_ONSTACK 。 . 若 用 sigaltstack(2) 声 明了 一 替换 栈 ， 
则 将 此 信和 号 递送 给 替换 栈 上 的 进程 
SA_RESETHAND . 在 此 信和 号 捕捉 函数 的 人 口 处 ， 将 此 信号 
的 处 理 方 式 复 位 为 SIG_DFL ， 并 清除 
SA_SIGINFO 标 志 。 注 意 ， 此 种 类 型 的 信 
号 对 应 于 早期 的 不 可 靠 信和 号。 但是， 不 能 
自动 复位 SIGILL 和 SIGTRAP 这 两 个 信和 号 
的 配置 。 设 置 此 标志 使 sigaction 的 行为 如 
同 SA_NODEFER 标 志 也 设置 了 一 样 
SA_RESTART . . 由 此 信号 中 断 的 系统 调用 会 自动 重启 动 
(参见 10.5 节 ) 
SA_SIGINFO 此 选项 对 信号 处 理 程序 提供 了 附加 信 
B: 一 个 指向 siginfo 结 构 的 指针 以 及 
一 个 指向 进程 上 下 文 标识 符 的 指针 
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sa_sigaction 字 段 是 一 个 替代 的 信号 处 理 程 序 ， 当 在 sigaction 结 构 中 使 用 了 
SA_SIGINFO 标 志 时 ， 使 用 该 信号 处 理 程序 。 对 于 sa_sigaction 字 段 和 sa_handler 字 上段 
这 两 者 ， 其 实现 可 能 使 用 同一 存储 区 ， 所 以 应 用 程序 只 能 一 次 使 用 这 两 个 字段 中 的 一 个 。 

通常 ， 按 下 列 方式 调用 信号 处 理 程序 : 

void handler (int signo) ; 

但 是 ， 如 果 设 置 了 SA_SIGINFo 标 志 ， 那 么 按 下 列 方式 调用 信号 处 理 程序 : 

void handler (int signo, siginfo t *info, void *context) ; 

siginfo _t 结 构 包 含 了 信号 产生 原因 的 有 关 信息 。 该 结构 的 大 致 样式 如 下 所 示 。POSIX.1 
依从 的 所 有 实现 必须 至 少 包括 si_signo 和 si_code 成 员 。 另 外 ，XSI 依 从 的 实现 至 少 应 包含 
下 列 字段: 


struct siginfo { 


int Si signo; /* signal number */ 

int si_errno; /* if nonzero, errno value from <errno.h> */ 
int si_code; /* additional info (depends on signal) */ 
pid t si pid; /* sending process ID */ 

uidotosi*uid; /* sending process real user ID */ 

void *si addr; /* address that caused the fault */ 

int si_status; /* exit value or signal number */ 


long si_band; /* band number for SIGPOLL */ 

ao possibly other fields also */ 

表 10-6 示 出 了 各 种 信号 的 si_code 值 ， 这 些 信 号 是 由 Single UNIX Specification AY. it 
意 ， 实 现 可 定义 附加 的 代码 值 。 

若 信 和 号 是 SIGCHLD， 则 将 设置 si_pia、si_status 和 si_uid 字 段 。 若 信和 号 是 SIGILEL 
或 SIGSEGV， 则 si_addr 包 仿造 成 故障 的 根源 地 址 ， 尽 管 该 地 址 可 能 并 不 准确 。 若 信号 是 
SIGPOLL， 那 么 si_band 字 段 将 包含 STREAMS 消 息 的 优先 级 段 (priority band)， 该 消息 产生 
POLL_IN、POLL_OUT 或 POLL_MSG 事 件 ( 关 于 优先 级 段 的 详细 讨论 ， 请 参见 Rago[1993])。 
si_errno 字 段 包 含 错误 编号 ， 它 对 应 于 引发 信号 产生 的 条 件 ， 并 由 实现 定义 。 

信号 处 理 程 序 的 context 参 数 是 无 类 型 指针 ， 它 可 被 强制 转换 为 cntext_t 结 构 类 型 ， 用 于 
标识 信号 传递 时 进程 的 上 下 文 。 

当 实 现 支持 实时 信号 扩展 时 、 用 SRA_STGINEFO 标 志 建 立 的 信号 处 理 程序 将 导致 信号 可 靠 地 排队 。 


一 些 保留 信号 可 由 实时 应 用 程序 使 用 。 如 果 信 号 由 sigaueue 产 生 ， 那 么 siginfo 结 构 能 包含 应 用 特有 
的 数据 。 我 们 不 再 进一步 讨论 实时 扩展 。 详 细 情 况 请 参见 Gallmeister[1995]。 


‘Rl: signal AH 


现在 用 sigaction 实 现 signal 国 数 。 很 多 平台 都 是 这 样 做 的 (POSIX.1 的 Rationale 也 说 
明 这 是 POSIX 所 希望 的 )。 另 一 方面 ， 有 些 系 统 支持 旧 的 不 可 靠 信号 语义 signal 函 数 。 其 目的 
是 实现 二 进 制 向 后 兼容 ， 除 非 明确 要 求 旧 的 不 可 靠 语 义 (为 了 向 后 兼容 )， 否 则 应 当 使 用 下 面 
的 signal 实 现 ， 或 者 直接 调用 sijgaction (可 以 在 调用 sigaction 了 时 指定 SA_RESETHAND 
和 SA_NODEFER 选 项 以 实现 旧 语 义 的 signal 函 数 )。 本 书 中 所 有 调用 signal 的 实例 均 调用 程 
序 清单 10-12 中 实现 的 该 函数 。 
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310-6 siginfo 七 代码 值 





L_ILLOPC 





L_ILLOPN 





L ILLTRP 






SIGILL 


SIGFPE 


LL ILLADR 


L PRVOPC 










LL PRVREG 
L COPROC 














b 
b 





L BADSTK 








BUS, ADRALN 
SIGBUS BUS. ADRERR 
BUS, OBJERR 


CLD EXITED 
CLD, KILLED 












CLD DUMPED 









CLD. TRAPPED 





CLD STOPPED 









CLD CONTINUED 


SIGCHLD 


SIGPOLL 
Any 


POLL IN 











POLL OUT 









POLL, MSG 
POLL ERR 






POLL PRI 








POLL HUP 





SI USER 
SI QUEUE 
SI TIMER 
SI ASYNCIO 
SI MESGQ 























SEGV. MAPERR 地 址 未 映射 到 对 象 
SIGSEGV 

SEGV_ACCERR 对 于 映射 对 象 的 无 效 权限 
STOTRAP TRAP_BRKPT 进程 断 点 陷入 

TRAP_TRACE 进程 跟踪 陷入 





非法 操作 码 
非法 操作 数 
非法 地 址 模式 
非法 陷入 
特权 操作 码 
特权 寄存 器 
协 处 理 器 出 错 
内 部 栈 出 错 


整数 除 以 0 
整数 溢出 
HERERDAO 
TA EE 
PART 
AA EER 
无 效 的 祁 点 运算 
下 标 越界 



























无 效 的 地 址 对 齐 
不 存在 的 物理 地 址 
对 象 特有 的 硬件 出 错 


子 进程 已 终止 

子 进程 已 异常 终止 (无 core) 
子 进程 已 异常 终止 (有 core) 
被 跟踪 的 子 进程 已 陷入 

子 进程 已 停止 
停止 的 子 进程 已 继续 
数据 可 读 
数据 可 写 
输入 消息 可 用 
IO 出 错 

高 优先 级 消息 可 用 
设备 断 开 连接 
kill 发 送 的 信号 
sigqueue 发 送 的 信号 (实时 扩展 ) 
timer_settime 设 置 的 计时 器 超时 (实时 扩展 ) 
异步 WO 请 求 完 成 (实时 扩展 ) 

一 条 消息 到 达 消 息 队 列 (实时 扩展 ) 
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程序 清单 10-12 用 sigaction 实 现 的 signal 函 数 
#include "apue.h" 


/* Reliable version of signal(), using POSIX sigaction(). */ 
Sigfunc * 

signal(int signo, Sigfunc *func) 

{ 


struct sigaction act, oact; 


act.sa_handler = func; 
sigemptyset (&act.sa_mask) ; 
act.sa_flags = 0; 
if (signo == SIGALRM) { 
#ifdef SA_INTERRUPT 
act.sa_flags |= SA_INTERRUPT; 
#endif 
} else { 
Hifdef SA RESTART 
act.sa_flags |= SA_RESTART; 
#endif 
} 
if (sigaction(signo, &act, &oact) « 0) 
return(SIG ERR); 
return(oact.sa handler); 


] 
注意 ， 必 须 用 sigemptyset 函 数 初始 化 act 结 构 的 sa_mask 成 员 。 不 能 保证 : 


act.sa mask = 0; 


会 做 同样 的 事情 。 
对 除 SIGALRM 以 外 的 所 有 信号 ， 我 们 都 有 意 尝 试 设置 SA_RESTART 标 志 ， 于 是 被 这 些 信号 
中 断 的 系统 调用 都 能 重启 动 。 不 希望 重启 动 由 SIGALRM 信 号 中 断 的 系统 调用 的 原因 是 : 我 们 希 
望 对 VO 操作 可 以 设置 时 间 限制 (请 回忆 有 关 程 序 清单 10-7 的 讨论 )。 
某 些 早期 系统 (如 SunOS) 定义 了 SRA_INTERRUPT 标 志 。 这 些 系统 的 默认 方式 是 重新 启动 被 
中 断 的 系统 调用 ， 而 指定 此 标志 则 使 系统 调用 被 中 断后 不 再 重启 动 。Linux 定 义 SA_INTERRUPT 
以 便 与 使 用 该 标志 的 应 用 程序 兼容 。 但 是 ， 如 若 信号 处 理 程序 是 用 sigaction 设 置 的 ， 
那么 其 默认 方式 是 不 重新 启动 系统 调用 。Single UNIX Specification 的 XSI 扩 展 规 定 ， 除 非 说 明了 
SA_RESTRRT 标 志 ， 否 则 sigaction 函 数 不 再 重启 动 被 中 断 的 系统 调用 。 


实例 : signal_intr 函 数 


265 


程序 清单 10-13 是 signal 函 数 的 另 一 种 版 本 ， 它 力图 阻止 任何 被 中 断 的 系统 调用 重启 动 。 


程序 清单 10-13 signal_intr 函 数 
Hinclude "apue .hn" 


Sigfunc * 
signal intr(int signo, Sigfunc *func) 
{ 


struct sigaction act, oact; 


act.sa_handler = func; 
sigemptyset (&act.sa mask); 
act.sa flags = 0; 

#ifdef SA INTERRUPT 
act.sa flags |- SA INTERRUPT; 
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#endif 
if (sigaction(signo, &act, &oact) < 0) 
return(SIG ERR); 
return(oact.sa handler); 


) 


如 果 系 统 定义 了 SA_INTERRUPT 标 志 ， 那 么 为 了 提高 可 移植 性 ， 我 们 在 sa_flags 中 增加 
该 标志 ， 这 样 也 就 阻止 了 被 中 断 的 系统 调用 重启 动 。 口 


10.15 sigsetjmp#lsiglongjmpmy zw 


7.10 节 说 明了 用 于 非 局 部 转移 的 setjmp 和 1ongjmp 函 数 。 在 信号 处 理 程序 中 经 常 调用 
longjmp 函 数 以 返回 到 程序 的 主 循环 中 ， 而 不 是 从 该 处 理 程序 返回 。 程 序 清单 10-5 和 程序 清单 
10-8 中 已 经 出 现 了 这 种 情况 。 

但 是 ， 调 用 Longjmp 有 一 个 问题 。 当 捕捉 到 一 个 信号 时 ， 进 入 信和 号 捕捉 函数 ， 此 时 当前 信 
号 被 自动 地 加 到 进程 的 信号 屏蔽 字 中 。 这 阻止 了 后 来 产生 的 这 种 信号 中 断 该 信号 处 理 程序 。 如 
果 用 longjmp 跳 出 信号 处 理 程序 ， 那 么 ， 对 此 进程 的 信号 屏蔽 字 会 发 生 什么 呢 ? 

在 FreeBSD 5.2.1 和 Mac OS X 10.3 中 ，setjmp 和 1longjmp 保 存 和 恢复 信号 屏 坑 字 。 但 是 ，Linux 


2.4.22 和 Solaris 9 并 不 执行 这 种 操作 。FreeBSD 5.2.1 和 Mac OS X 10.3 提 供 函 数 _setjmp 和 _longjmp， 
它们 也 不 保存 和 恢复 信号 屏 项 字 。 


为 了 允许 两 种 形式 的 行为 并 存 ，POSIX.1 并 没有 说 明 setjmp 和 1ongjmp 对 信号 屏蔽 字 的 
作用 ， 而 是 定义 了 两 个 新 函数 sigsetjmp 和 siglongjmp。 在 信号 处 理 程序 中 进行 非 局 部 转 
移 时 应 当 使 用 这 两 个 函数 。 

#include <setjmp.h> 

int sigsetjmp(sigjmp buf env, int savemask) ; 


返回 值 : 若 直 接 调 用 则 返回 0， 若 从 siglongjmp 调 用 返回 则 返回 非 0 值 


void siglongjmp(sigjmp_buf env, int val); 





这 两 个 函数 与 setjmp 和 1ongjmp 之 间 的 唯一 区 别 是 sigsetJjmp 增 加 了 一 个 参数 。 如 果 
savemask 提 0， 则 sigsetjmp 在 env 中 保存 进程 的 当前 信号 屏蔽 字 。 调 用 siglongjmp 时 ， 如 果 
带 非 0 savemask 的 sigsetjmp 调 用 已 经 保存 了 env， 则 siglongjmp 从 其 中 恢复 保存 的 信号 屏 
蔽 字 。 


€ B 


程序 清单 10-14 演 示 了 在 信号 处 理 程序 被 调用 时 ， 系 统 所 设置 的 信号 屏蔽 字 如 何 自动 地 包括 
刚 被 捕捉 到 的 信和 号。 该 程序 也 通过 实例 说 明了 如 何 使 用 sigsetjmp 和 siglongjmp 函 数 。 
程序 清单 10-14 信和 号 屏蔽 字 、sigsetjmp 和 siglongjmp 实 例 


#include "apue.h" 
#include «setjmp.h» 
#include <time.h> 


static void sig usrl(int), sig alrm(int); 
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static sigjmp_buf jmpbuf; 
Btatic volatile sig atomic t canjump; 
int 


main (void) 


if (signal (SIGUSR1, Big usrl) == SIG ERR) 
err_sys ("signal (SIGUSR1) error"); 
if (signal (SIGALRM, sig alrm) == SIG ERR) 


err_sys ("signal (SIGALRM) error"); 
pr_mask ("starting main: "); 
if (sigsetjmp(jmpbuf, 1)) { 

pr_mask ("ending main: "); 

exit (0); 


canjump = 1; /* now sigsetjmp() is OK */ 


for (75 ;) 
pause() ; 


) 


static void 
Sig usrl(int signo) 


{ 


time t starttime; 


if (canjump == 0) 
return; /* unexpected signal, ignore */ 


pr mask("starting Big uBrl: "js 


alarm(3); /* SIGALRM in 3 seconds */ 
Starttime = time (NULL); 
for ( ; i) /* busy wait for 5 Beconds */ 
if (time(NULL) > starttime + 5) 
break; 


pr_mask ("finishing sig uBrl: ss 


canjump = 0; 

siglongjmp(jmpbuf, 1); /* jump back to main, don't return */ 
) 
static void 


sig alrm(int signo) 


pr mask("in sig alrm: "); 


一 


此 程序 演示 了 另 一 种 技术 ， 只 要 在 信号 处 理 程序 中 调用 siglongjmp， 就 应 使 用 这 种 技术 。 
仅 在 调用 sigsetjmp 之 后 才 将 变量 canjump 设 置 为 非 0 值 。 在 信号 处 理 程 序 中 检测 此 变量 ， 仅 
当 它 为 非 0 值 时 才 调 用 siglongjme。 这 提供 了 一 种 保护 机 制 ， 使 得 在 jmpbuf ( 跳 转 缓冲 ) 尚 
未 由 sigsetjmp 初 始 化 时 ， 防 止 调用 信号 处 理 程序 (在 本 程序 中 ， 调 用 siglongjmp 之 后 程序 
很 快 就 结束 ， 但 是 在 较 大 的 程序 中 ， 在 调用 siglongjmp 之 后 的 一 段 较 长 时 间 内 ， 信 号 处 理 程 
序 可 能 仍旧 被 设置 ) 。 在 一 般 的 C 代 码 中 (不 是 信号 处 理 程序 ) ， 对 于 longjmp 并 不 需要 这 种 保 
护 措施 。 但 是 ， 因 为 信号 可 能 在 任何 时 候 发 生 ， 所 以 在 信号 处 理 程序 中 ， 需 要 这 种 保护 措施 。 

在 程序 中 使 用 了 数据 类 型 sig_atomic_t， 这 是 由 ISO C 标 准 定义 的 变量 类 型 ， 在 写 这 种 
类 型 的 变量 时 不 会 被 中 断 。 它 意味 着 在 具有 虚拟 存储 器 的 系统 上 这 种 变量 不 会 跨越 页 边界 ， 可 
以 用 一 条 机 器 指令 对 其 进行 访问 。 这 种 类 型 的 变量 总 是 包括 ISO 类 型 修饰 符 volatile， 其 原 
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Bie: 该 变量 将 由 两 个 不 同 的 控制 线程 一 一 main 函 数 和 异步 执行 的 信号 处 理 程序 访问 。 
图 10-1 显 示 了 此 程序 的 执行 时 间 顺 序 。 











main 
signal () 
signal () 
pr_mask () 
sigsetjmp () 
pause ( 
SIGUSR1 delivered 
pr_mask () 
alarm() 
time() 
time() 
time() 
t SIGALRM delivered 
pr_mask () 
«o - réturn() 
; ”从 信和 号 处 理 程序 返回 
pr_mask () 
sigset jmp () siglongjmp() 
pr mask() 


exit() 
图 10-1 处 理 两 个 信号 的 实例 程序 的 时 间 顺 序 


可 将 图 10-1 分 成 三 部 分 : 左面 部 分 〈 对 应 于 main)、 中 间 部 分 (sig usr1) 和 右面 部 分 
(sig_alrm)。 在 进程 执行 左面 部 分 时 ， 信 号 屏蔽 字 是 0 (没有 信和 号 是 阻塞 的 ) 。 而 执行 中 间 部 
分 时 ， 其 信号 屏蔽 字 是 SIGUSR1。 执 行 右面 部 分 时 ， 信 号 屏蔽 字 是 SIGUSR1 | SIGALRM, 

执行 程序 清单 10-14， 得 到 下 面 的 输出 : 


$ ./a.out & 在 后 台 启 动 进程 
starting main: 

[1] 531 作业 控制 shel 打 印 其 进程 ID 
$ kill -USR1 531 向 该 进程 发 送 SIGUSR1 


starting sig usrl: SIGUSR1 

$ in sig alrm: SIGUSR1 SIGALRM 

finishing sig usrl: SIGUSR1 

ending main: 

键 人 回 车 

[1] + Done ./a.out & 
该 输出 与 我 们 所 期 望 的 相同 ， 当 调用 一 个 信号 处 理 程序 时 ， 被 捕捉 到 的 信号 加 到 进程 的 当前 信 
号 屏蔽 字 中 。 当 从 信号 处 理 程序 返回 时 ， 恢 复原 来 的 屏 项 字 。 另 外 ，siglongjmp 恢 复 了 由 
sigsetjmp 保 存 的 信号 屏蔽 字 。 

如 果 在 Linux 2.4.22 中 将 程序 清单 10-14 中 的 sigsetjmp 和 siglongjmp 分 别 替 换 成 _setjmp 
fü longjmp (在 FreeBSD 中 ， 则 替换 成 _setjmp 和 _1ongjmp)， 则 最 后 一 行 输出 变 成 : 

ending main: SIGUSR1 
这 音 味 着 在 调用 _setjmp 之 后 执行 hain 函 数 时 ， 其 SIGUSR1 是 阻塞 的 。 这 多 半 不 是 我 们 所 希 
AW. 口 


10.16 sigsuspend 函 数 
上 面 已 经 说 明 ， 更 改进 程 的 信号 屏蔽 字 可 以 阻塞 所 选择 的 信忠， 或 解除 对 它们 的 阻塞 。 使 
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用 这 种 技术 可 以 保护 不 希望 由 信号 中 断 的 代码 临界 区 。 如 果 和 希望 对 一 个 信号 解除 阻塞 ， 然 后 
pause 以 等 待 以 前 被 阻塞 的 信号 发 生 ， 则 又 将 如 何 呢 ? 假定 信号 是 SIGINT， 实 现 这 一 点 的 一 
种 不 正确 的 方法 是 ， 

sigset_t newmask, oldmask; 


sigemptyset (&newmask) ; 
sigaddset (&newmask, SIGINT); 


/* block SIGINT and save current signal mask */ 
if (sigprocmask(SIG BLOCK, &newmask, &oldmask) < 0) 
err_sys("SIG BLOCK error") ; 


/* critical region of code */ 


/* reset signal mask, which unblocks SIGINT */ 
if (sigprocmask(SIG_SETMASK, &oldmask, NULL) < 0) 
err Sys("SIG SETMASK error"); 


/* window is open */ 
pause(); /* wait for signal to occur */ 


/* continue processing */ 

如 果 在 信和 号 阻塞 时 将 其 发 送 给 进程 ， 那 么 该 信号 的 传递 就 被 推迟 直到 对 它 解除 了 阻塞 。 对 
应 用 程序 而 言 ， 该 信号 好 像 发 生 在 解除 对 SIGINT 的 阻塞 和 pause 之 间 (取决 于 内 核 如 何 实现 
信号 。) 。 如 果 发 生 了 这 种 情况 ， 或 者 如 果 在 解除 阻塞 时 刻 和 pause 之 间 确 实 发 生 了 信和 号， 那么 
就 产生 了 问题 。 因 为 我 们 可 能 不 会 再 见 到 该 信号 ， 所 以 从 这 种 意义 上 而 言 ， 在 此 时 间 窗 口中 发 
生 的 信号 丢失 了 ， 这 样 就 使 得 pause 永 远 阻 塞 。 这 是 早期 的 不 可 靠 信号 机 制 的 另 一 个 问题 。 

为 了 纠正 此 问题 ， 需 要 在 一 个 原子 操作 中 先 恢复 信号 屏蔽 字 ， 然 后 使 进程 休眠 。 这 种 功能 
是 由 sigsuspend 函 数 提供 的 。 


#include <signal.h> 


int sigsuspend(const sigset t *sigmask) ; 





返回 值 : -1， 并 将 errno 设 置 为 BINTR 


将 进程 的 信号 屏蔽 字 设 置 为 由 sigmmask 指 向 的 值 。 在 捕 提 到 一 个 信号 或 发 生 了 一 个 会 终止 该 
进程 的 信和 号 之 前 ， 该 进程 被 挂 起 。 如 果 捕 捉 到 一 个 信号 而 且 从 该 信号 处 理 程序 返回 ， 则 
sigsuspend 返 回 ， 并 且 将 该 进程 的 信号 屏蔽 字 设 置 为 调用 sigsuspend 之 前 的 值 。 

注意 ， 此 函数 没有 成 功 返 回 值 。 如 果 它 返回 到 调用 者 ， 则 总 是 返回 1， 并 将 errno 设 置 为 
EINTR (表示 一 个 被 中 断 的 系统 调用 )。 






程序 清单 10-15 显 示 了 保护 临界 区 ， 使 其 不 被 特定 信号 中 新 的 正确 方法 。 
程序 清单 10-15 保护 临界 区 不 被 信号 中 断 

#include "apue.h' 

static void sig int (int); 


int 
main (void) 
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sigset_t newmask, oldmask, waitmask; 
pr_mask ("program start: "); 


if (signal (SIGINT, sig int) == SIG ERR) 
err_sys("signal (SIGINT) error"); 

sigemptyset (&waitmask) ; 

sigaddset (&waitmask, SIGUSR1) ; 

sigemptyset (&newmask) ; 

sigaddset (&newmask, SIGINT); 


/* 

* Block SIGINT and save current signal mask. 

*/ 

if (sigprocmask (SIG BLOCK, &newmask, &oldmask) < 0) 
err Sys("SIG BLOCK error"); 


/* 
* Critical region of code. 
*/ 
pr mask("in critical region: "); 
/* 
* Pause, allowing all signals except SIGUSR1. 
*/ 
if (sigsuspend(&waitmask) != -1) 


err sys("sigsuspend error"); 
pr mask("after return from sigsuspend: "); 


/* 

* Reset signal mask which unblocks SIGINT. 

*/ 

if (sigprocmask(SIG SETMASK, &oldmask, NULL) « 0) 
err Bys("SIG SETMASK error"); 


/* 
* And continue processing ... 
*/ 


pr_mask ("program exit: "); 


exit(0); 


) 


Btatic void 
sig int(int signo) 


pr_mask("\nin sig int: "); 


) 


注意 ， 当 sigsuspend 返 回 时 ， 它 将 信号 屏 茂 字 设 置 为 调用 它 之 前 的 值 。 在 本 例 中 ， 
sIGINT 信 号 将 被 阻塞 。 因 此 将 信号 屏蔽 字 复 位 为 早先 保存 的 值 (oldmask)。 

运行 程序 清单 10-15 得 到 下 面 的 输出 : 

$ ./a.out 

program start: 

in critical region: SIGINT 

^? 键 人 中 断 字符 

in sig int: SIGINT SIGUSR1 


after return from sigsuspend: SIGINT 
program exit: 
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在 调用 sigsuspend 时 ， 将 SIGUSR1 信 号 加 到 了 进程 信号 屏 项 字 中 ， 所 以 当 运 行 该 信号 处 
理 程 序 时 ， 我 们 得 知 信和 号 屏蔽 字 已 经 改变 了 。 从 中 可 见 ， 在 sigsuspend 返 回 时 ， 它 将 信号 屏 
项 字 恢 复 为 调用 它 之 前 的 值 。 口 





sigsuspend 的 另 一 种 应 用 是 等 待 一 个 信号 处 理 程序 设置 一 个 全 局 变量 。 程 序 清单 10-16 
用 于 捕捉 中 断 信 号 和 退出 信号 ， 但 是 希望 仅 当 捕捉 到 退出 信号 时 ， 才 唤醒 主 例 程 。 


程序 清单 10-16 用 sigsuspend 等 待 一 个 全 局 变量 被 设置 


#include "apue.h" 
volatile sig atomic t quitflag; /* set nonzero by signal handler */ 


Btatic void 
Sig int(int signo) /* one signal handler for SIGINT and SIGQUIT */ 


if (signo == SIGINT) 
printf ("Mninterrupt Wn"); 
else if (signo == SIGQUIT) 
quitflag = 1; /* set flag for main loop */ 
} 
int 
main (void) 


{ 


sigset_t newmask, oldmask, zeromask; 

if (signal (SIGINT, sig int) == SIG ERR) 
err sys("signal(SIGINT) error"); 

if (signal(SIGQUIT, sig int) -- SIG ERR) 


err sys("Bignal(SIGQUIT) error"); 


sigemptyset (&zeromask) ; 
sigemptyset (&newmask) ; 
sigaddset (&newmask, SIGQUIT); 


/* 
* Block SIGQUIT and save current signal mask. 
*/ 
if (sigprocmask(SIG BLOCK, &newmask, &oldmask) « 0) 
err Sys("SIG BLOCK error"); 


while (quitflag -- 0) 
sigsuspend (&zeromask) ; 


/* 
* SIGQUIT has been caught and is now blocked; do whatever. 
*/ 

quitflag = 0; 


/* 

* Reset signal mask which unblocks SIGQUIT. 

*/ 

if (sigprocmask(SIG SETMASK, &oldmask, NULL) « 0) 
err sys("SIG SETMASK error"); 


exit(0); 
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此 程序 的 示例 输出 是 : 

$ ./a.out 

^? 键入 中 断 字符 
interrupt 

a? 再 次 键入 中 断 字 符 
interrupt 

^? 再 一 次 
interrupt 

205 再 一 次 
interrupt 

n? 再 一 次 
interrupt 

22? 再 一 次 
interrupt 

^? 再 一 次 
interrupt 

2NES 用 退出 符 终止 口 


考虑 到 支持 ISO C 的 非 POSIX 系 统 与 POSIX 系 统 两 者 之 间 的 可 移植 性 ， 在 一 个 信号 处 理 程序 中 我 们 
唯一 应 当做 的 是 赋 一 个 值 给 类 型 为 sig_atomic t 的 变量 。POSIX.1 规 定 得 更 多 一 些 ， 它 详细 说 明了 在 
一 个 信号 处 理 程 序 中 可 以 安全 地 调用 的 也 数 列表 ( 见 表 10-3) ， 但 是 如 果 这 样 编写 代码 ， 则 它们 可 能 不 
会 正确 地 在 非 POSIX 系 统 上 运行 。 


可 以 用 信号 实现 父 、 子 进程 之 间 的 同步 ， 这 是 信号 应 用 的 另 一 个 实例 。 程 序 清单 10-17 包 含 
了 8.9 节 中 提 和 到 的 五 个 例 程 的 实现 ， 它 们 是 : TELL_WAIT, TELL_PARENT, TELL_CHILD, 
WAIT PARENTÁA[WAIT CHILD, 


程序 清单 10-17 父子 进程 可 用 来 实现 同步 的 例 程 
#include "apue.h" 


static volatile sig atomic_t sigflag; /* set nonzero by sig handler */ 
static sigset_t newmask, oldmask, zeromask; 


static void 
sig usr(int signo) /* one signal handler for SIGUSR1 and SIGUSR2 */ 


sigflag = 1; 
void 


TELL WAIT (void) 


{ 


if (signal (SIGUSR1, sig_usr) == SIG ERR) 
err_sys("signal(SIGUSR1) error"); 
if (signal (SIGUSR2, sig usr) == SIG ERR) 


err sys("signal(SIGUSR2) error"); 
sigemptyset (&zeromask) ; 
sigemptyset (&newmask) ; 
sigaddset (&newmask, SIGUSR1) ; 
sigaddset (&newmask, SIGUSR2); 


/* 
* Block SIGUSR1 and SIGUSR2, and save current signal mask. 
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*/ 
if (sigprocmask(SIG BLOCK, &newmask, &oldmask) « 0) 
err Sys("SIG BLOCK error"); 
) 


void 
TELL PARENT (pid t pid) 


kill(pid, SIGUSR2); /* tell parent we're done */ 


) 


void 
WAIT PARENT (void) 
( 
while (sigflag == 0) 


sigsuspend(&zeromask);  /* and wait for parent */ 
sigflag = 0; 
/* 
* Reset signal mask to original value. 
*/ 


if (sigprocmask(SIG SETMASK, &oldmask, NULL) « 0) 
err Sys("SIG SETMASK error"); 
) 


void 
TELL CHILD(pid t pid) 
kill(pid, SIGUSR1); /* tell child we're done */ 
void 
WAIT CHILD (void) 


while (sigflag == 0) 


sigsuspend(&zeromask); /* and wait for child */ 
sigflag = 0; 
/* 
* Reset signal mask to original value. 
*/ 


if (sigprocmask (SIG SETMASK, &oldmask, NULL) < 0) 
err Sys("SIG SETMASK error"); 
} 


其 中 使 用 了 两 个 用 户 定 义 的 信号 ，SIGUSR1 由 父 进程 发 送 给 子 进 程 ，SIGUSR2 由 子 进 程 


发 送 给 父 进程 。 程 序 清单 15-3 示 出 了 使 用 管道 的 这 五 个 函数 的 另 一 种 实现 。 口 

如 果 在 等 待 信号 发 生 时 希望 去 休 卢 ， 则 使 用 sigsuspend 函 数 是 非常 适当 的 (正如 前 面 两 
个 例子 中 所 示 ) ， 但 是 如 果 在 等 待 信号 期 间 希 望 调用 其 他 系统 函数 ， 那 么 将 会 怎样 呢 ? 不 幸 的 
是 ， 在 单线 程 环 境 下 对 此 问题 没有 妥善 的 解决 方法 。 如 果 可 以 使 用 多 线程 ， 则 可 专门 安排 一 个 
线程 处 理 信 号 〈( 见 12.8 节 中 的 讨论 ) 。 

如 果 不 使 用 线程 ， 那 么 我 们 能 尽力 做 到 最 好 的 是 ， 当 信和 号 发 生 时 ， 在 信和 号 捕捉 程序 中 对 一 
个 全 局 变量 置 1。 例 如 ， 若 我 们 捕捉 STIGINT 和 SIGALRM 这 两 种 信号 ， 并 用 signal_intr 函 数 
设置 这 两 个 信号 的 处 理 程序 使 得 它们 中 断 任 一 被 阻塞 的 低速 系统 调用 。 当 进程 阻塞 在 
select 函 数 调用 ( 见 12.5.1 节 ) 等 待 低速 设备 输入 时 ， 很 可 能 发 生 这 两 种 信号 〈 如 果 设 置 闹钟 
以 阻止 永远 等 竺 输入， 那么 对 于 STGALRM 信 号 ， 这 是 特别 真实 的 )。 处 理 这 种 问题 的 代码 类 似 
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于 下 面 所 示 : 
if (intr flag) /* flag set by our SIGINT handler */ 
handle intr(); 
if (alrm flag) /* flag set by our SIGALRM handler */ 


handle alrm(); 
/* signals occurring in here are lost */ 


while (select( ... ) « 0) { 
if (errno == EINTR) { 
if (alrm_flag) 
handle _alrm() ^ 
else if (intr_flag) 
handle intr(); 
) eise ( 
/* some other error */ 
) 


) 


在 调用 select 之 前 测试 各 全 局 标志 ， 如 果 select 返 回 一 个 中 断 的 系统 调用 错误 ， 则 再 次 
进行 测试 。 如 果 在 前 两 个 if 语 名 和 后 随 的 select 调 用 之 间 捕 提 到 两 个 信号 中 的 任意 一 个 ， 则 
问题 就 发 生 了 。 正 如 代码 中 的 注释 所 指出 的 ， 在 此 处 发 生 的 信号 丢失 了 。 调 用 信号 处 理 程序 ， 
它们 设置 了 相应 的 全 局 变量 ,但 是 select 决 不 会 返回 (除非 某 些 数据 已 准备 好 可 读 )。 

我 们 希望 按 顺 序 执行 下 列 操作 步 又 ， 

(1) 阻塞 SIGINT 和 SIGALRM。 

(2) 测试 两 个 全 局 变量 以 判别 是 否 发 生 了 一 个 信号 ， 如 果 已 发 生 则 对 此 进行 处 理 。 

(3) 调用 select (或 任何 其 他 系统 调用 ， 例 如 read) 并 解除 对 这 两 个 信和 号 的 阻塞 ， 这 两 
个 操作 应 当 是 一 个 原子 操作 。 

仅 当 第 (3) 步 是 pause 操 作 时 ，sigsuspend 函 数 才能 帮助 我 们 。 


10.17 abort% 
前 面 已 提 及 abort 函 数 的 功能 是 使 异常 程序 终止 。 


#include <stdlib.h> 


void abort (void); 





此 函数 将 STGABRT 信 号 发 送 给 调用 进程 (进程 不 应 忽略 此 信号 )。ISO C 规 定 ， 调 用 abort 
将 向 主机 环境 递送 一 个 未 成 功 终止 的 通知 ， 其 方法 是 调用 raise (SIGABRT) 函数 。 

ISO C 要 求 若 捕捉 到 此 信号 而 且 相 应 信号 处 理 程序 返回 ，abort 仍 不 会 返回 到 其 调用 者 。 
如 果 捕 提 到 此 信号 ， 则 信号 处 理 程序 不 能 返回 的 唯一 方法 是 它 调用 exit、_exit、_Exit、 
longjmp 或 siglongjmp。 (10.15 节 讨论 了 longjmp 和 siglongjmp 之 间 的 区 别 。) POSIX.1 
也 说 明 abort 并 不 理会 进程 对 此 信号 的 阻塞 和 忽略 。 

让 进程 捕捉 STGABRT 的 意图 是 ， 在 进程 终止 之 前 由 其 执行 所 需 的 清理 操作 。 如 果 进 程 并 不 
在 信号 处 理 程序 中 终止 自己 ，POSIX.1 声 明 当 信号 处 理 程序 返回 时 ，abort 终 止 该 进程 。 

ISO C 针 对 此 函数 的 规范 将 下 列 问题 留 由 实现 决定 :是否 要 冲洗 输出 流 以 及 是 否 要 删除 临 
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时 文件 〈 见 5.13 节 )? POSIX.1 的 要 求 则 更 进一步 ， 它 要 求 如 果 abort 调 用 终止 进程 ， 则 它 对 所 
有 打开 标准 VO 流 的 效果 应 当 与 进程 终止 前 对 每 个 流 调 用 fclose 相 同 。 


在 系统 V 的 早期 版 本 中 ，abort 示 数 产生 SIGIOT 信 号 。 更 进一步 讲 ， 进 程 息 略 此 信号 或 者 捕捉 它 
并 从 信号 处 理 程 序 返 回 ， 这 都 是 可 能 的 ， 在 返回 情况 下 ，abort 返 回 到 它 的 调用 者 。 

4.3BSD 产 生 SIGILL 信 号 。 在 此 之 前 ， 该 函数 解除 对 此 信号 的 阻塞 ， 将 其 配置 恢复 为 SIG_DFL 
(终止 并 构造 core 文 件 )。 这 阻止 一 个 进程 忽略 或 捕捉 此 信号 。 

历史 上 ，abort 的 各 种 实现 在 如 何 处 理 标准 IO 流 方 面 并 不 相同 。 对 于 保护 性 的 程序 设计 以 及 为 提 
高 可 移植 性 ， 如 果 和 希望 冲洗 标准 IO 流 ， 则 在 调用 abort 之 前 要 执行 这 种 操作 。 在 err_dump 函 数 中 实现 
了 这 一 点 ( 见 附 录 B)。 

因为 大 多 数 UNIX tmpfile (临时 文件 ) 的 实现 在 创建 该 文件 之 后 会 立即 调用 unlink, 所 以 ISO 
C 关 于 临时 文件 的 警告 通常 与 我 们 无 关 。 


程序 清单 10-18 中 的 abort 函 数 是 按 POSIX.1 说 明 实现 的 。 
程序 清单 10-18 abort 的 POSIX.1 实 现 


#include <signal.h> 
#include <stdio.h> 
#include <stdlib.h> 
#include <unistd.h> 


void 
abort (void) /* POSIX-style abort () function */ 
{ 
sigset t mask; 
struct sigaction action; 
/* 
* Caller can't ignore SIGABRT, if so reset to default. 
x 


Sigaction(SIGABRT, NULL, &action); 

if (action.sa handler -- SIG IGN) ( 
action.sa handler - SIG DFL; 
sigaction(SIGABRT, &action, NULL): 


] 


if (action.sa handler -- SIG DFL) 
fflush (NULL); /* flush all open stdio streams */ 
/* 
* Caller can't block SIGABRT; make sure it’s unblocked. 
7 


sigfillset (&mask) ; 
sigdelset (&mask, SIGABRT); /* mask has only SIGABRT turned off */ 
sigprocmask (SIG SETMASK, &mask, NULL); 


kill (getpid(), SIGABRT) ; /* send the signal */ 
/* 
* If we're here, process caught SIGABRT and returned. 
n 
fflush (NULL); /* flush all open stdio streams */ 
action.sa handler - SIG DFL; 
sigaction(SIGABRT, &action, NULL);  /* reset to default */ 
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sigprocmask(SIG_SETMASK, &mask, NULL); /* just in case ... */ 
kill(getpid(), SIGABRT); /* and one more time */ 
exit(1); /* this should never be executed ... */ 





首先 查看 是 否 将 执行 默认 动作 ， 若 是 则 冲洗 所 有 标准 MO 流 。 这 并 不 等 价 于 对 所 有 打开 的 流 
调用 fclose (因为 只 冲洗 ， 并 不 关闭 它们 ) ， 但 是 当 进 程 终止 时 ， 系 统 会 关闭 所 有 打开 的 文件 。 
如 果 进 程 捕捉 此 信号 并 返回 ， 那 么 因为 进程 可 能 产生 了 更 多 的 输出 ， 所 以 再 一 次 冲洗 所 有 的 流 。 
不 进行 冲洗 处 理 的 唯一 条 件 是 如 果 进 程 捕捉 此 信号 ， 然 后 调用 _exit 或 _Exit。 在 这 种 情况 下 ， 
内 存 中 任何 未 冲洗 的 标准 VO 缓冲 区 都 被 丢弃 。 我 们 假定 捕 提 此 信和 号， 而且 _exit 或 _Exit 的 
调用 者 并 不 想 要 冲洗 缓冲 区 。 

回忆 10.9 节 ， 如 果 调 用 ki11 使 其 为 调用 者 产生 信号 ， 并 且 如 果 该 信号 是 不 被 阻塞 的 (程序 
清单 10-18 保 证 做 到 这 一 点 ) ， 则 在 ki11 返 回 前 该 信号 (或 某 个 未 决 、 未 阻塞 的 信号 ) 就 被 传送 
给 了 该 进程 。 我 们 阻塞 除 SIGABRT 之 外 的 所 有 信号 ， 这 样 就 可 知 如 果 对 ki11 的 调用 返回 了 ， 
则 该 进程 一 定 已 捕捉 到 该 信号 ， 并 且 也 从 该 信号 处 理 程序 返回 。 口 


10.18 systema 


8.13 节 中 已 经 有 了 一 个 system 函 数 的 实现 ， 但 是 该 版 本 并 不 执行 任何 信号 处 理 。POSIX.1 要 
求 system 忽 略 SIGINT 和 SIGQUIT， 阻 塞 STGCHLD。 在 给 出 一 个 正确 地 处 理 这 些 信 和 号 的 一 个 
版 本 之 前 ， 先 说 明 为 什么 要 考虑 信和 号 处 理 。 





程序 清单 10-19 使 用 8.13 节 中 的 system 版 本 ， 用 其 调用 ed(1) 编 辑 器 。(ed 很 久 以 来 就 是 
UNIX 的 组 成 部 分 。 在 这 里 使 用 它 的 原因 是 : 它 是 捕捉 中 断 和 退出 信号 的 交互 式 程序 。 若 从 
shell 调 用 edq， 并 键入 中 断 字符 ， 则 它 捕捉 中 断 信号 并 打印 问号 。 它 还 将 对 退出 符 的 处 理 方式 设 
置 为 忽略 。) 


程序 清单 10-19 — 用 gystem 调 用 ed 编辑 器 
#include "apue.h" 


static void 
sig_int(int signo) 


printf ("caught SIGINT\n") ; 
static void 
sig chld(int signo) 

printf ("caught SIGCHLD\n") ; 


int 
main (void) 


if (signal(SIGINT, sig_int) == SIG_ERR) 
err_sys("signal(SIGINT) error"); 
if (signal (SIGCHLD, sig chld) == SIG ERR) 
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err sys("signal(SIGCHLD) error"); 
if (system("/bin/ed") « 0) 

err sys("system() error"); 
exit (0); 


} 
程序 清单 10-19 用 于 捕 拖 SIGINT 和 STGCHLD 信 号 。 若 调用 它 则 可 得 ， 


$ ./a.out 

a 将 正文 添加 至 编辑 器 缓冲 区 

Here is one line of text 

: 行 首 的 点 停止 添加 方式 

1, 8P 打印 缓冲 区 中 的 第 1 行 至 最 后 1 行 ， 以 便 观 察 其 内 容 
Here is one line of text 

w temp. foo 将 缓冲 区 写 至 一 文件 

编辑 器 称 写 了 25 个 字 节 

caught SIGCHLD 离开 编辑 器 


当 编 辑 器 终止 时 ， 系 统 向 父 进程 (a .out 进程) 发 送 SIGCHLD 信 号 。 父 进程 捕捉 它 ， 然 后 
从 信和 号 处 理 程序 返回 。 但 是 若 父 进程 正在 捕 提 SIGCHLD 信 号 (因为 它 创 建 了 子 进程 ， 所 以 应 当 
这 样 做 以 便 了 解 它 的 子 进程 在 何 时 终止 )， 那 么 正在 执行 sys tem 函 数 时 ， 应 当 阻 塞 对 父 进程 递 
送 STGCHLD 信 和 号。 实际 上 ， 这 就 是 POSIX.1 所 说 明 的 。 否 则 ， 当 system 创 建 的 子 进程 结束 时 ， 
system 的 调用 者 可 能 错误 地 认为 ， 它 自己 的 一 个 子 进程 结束 了 。 于 是 ， 调 用 者 将 会 调用 一 种 
wait 消 数 以 获得 子 进 程 的 终止 状态 ， 这 样 就 阻止 了 system 消 数 获 得 子 进程 的 终止 状态 ， 并 将 
其 作为 它 的 返回 值 。 

如 果 再 次 执行 该 程序 ， 在 这 次 运行 时 将 一 个 中 断 信 和 号 传送 给 编辑 器 ， 则 可 得 : 


$ ./a.out 

a 将 正文 添加 至 编辑 器 缓冲 区 

hello, world 

x 行 首 的 点 停止 添加 方式 

1,$p 打印 缓冲 区 中 的 第 1 行 至 最 后 1 行 ， 以 便 观 察 其 内 容 

hello, world 

w temp. foo 将 缓冲 区 写 至 一 文件 

13 编辑 器 称 写 了 13 个 字 节 

^? 键入 中 断 符 

? 编辑 器 捕捉 信号 ， 打 印 问号 

caught SIGINT 父 进程 执行 同一 操作 
离开 编辑 器 


q 
caught SIGCHLD 


回忆 9.6 节 可 知 ， 键 入 中 断 字符 可 使 中 断 信 号 传送 给 前 台 进 程 组 中 的 所 有 进程 。 图 10-2 显 示 
了 编辑 程序 正在 运行 时 的 各 个 进程 的 关系 。 


m 
1 

fork fork fork 
登录 shell oe ae /bin/sh /bin/ed | i 


AREA 前 台 进程 组 
图 10-2 程序 清单 10-19 运 行 时 的 前 台 和 后 台 进程 组 


在 这 一 实例 中 ，SIGINT 被 送 给 三 个 前 台 进 程 (shell 进 程 忽略 此 信号 )。 从 输出 中 可 见 ， 
a.out 进 程 和 eq 进程 捕捉 该 信号 。 但 是 ， 当 用 system 运 行 另 一 个 程序 (例如 ed) 时 ， 不 应 使 
父 、 子 进程 两 者 都 捕捉 终端 产生 的 两 个 信号 : 中 断 和 退出 。 这 两 个 信号 只 应 送 给 正在 运行 的 程 


bbs.theithome.com 


342 
2 
343 








278 RIO 信 号 





FF: 子 进 程 。 因 为 由 system 执 行 的 命令 可 能 是 交互 式 命令 (如 本 例 中 的 eq 程序 ) ， 以 及 因为 
system 的 调用 者 在 程序 执行 时 放弃 了 控制 ， 等 待 该 执行 程序 的 结束 ， 所 以 system 的 调用 者 就 
不 应 接收 这 两 个 终端 产生 的 信号 。 这 就 是 为 什么 POSIX.1 规 定 system 的 调用 者 应 当 忽 略 这 两 个 
信号 的 原因 。 口 





程序 清单 10-20 显 示 了 system 函 数 的 另 一 个 实现 ， 它 进行 了 所 要 求 的 信号 处 理 。 
程序 清单 10-20 system 函数 的 POSIX.1 正 确实 现 





#include <sys/wait.h> 
#include <errno.h> 
#include <signal.h> 
#include <unistd.h> 
int 


system(const char *cmdstring) /* with appropriate signal handling */ 


{ 


pid_t pid; 

int status; 

struct sigaction ignore, saveintr, savequit; 
sigset_t chidmask, savemask; 


if (cmdstring == NULL) 
return (1); /* always a command processor with UNIX */ 


ignore.sa_handler = SIG_IGN; /* ignore SIGINT and SIGQUIT */ 
sigemptyset (&ignore.sa_mask) ; 
ignore.sa_flags = 0; 
if (sigaction(SIGINT, &ignore, &saveintr) « 0) 
return(-1); 
if (sigaction(SIGQUIT, &ignore, &savequit) « 0) 
return (-1) ; 
sigemptyset (&chldmask) ; /* now block SIGCHLD */ 
sigaddset (&chldmask, SIGCHLD) ; 


if (sigprocmask(SIG BLOCK, &chldmask, &savemask) < 0) 
return(-1); 


if ((pid = fork0) < 0) { 
Status - -1; /* probably out of processes */ 
] else if (pid == 0) { /* child */ 
/* restore previous signal actions & reset Signal mask */ 
Sigaction(SIGINT, &saveintr, NULL); 
sigaction(SIGQUIT, &savequit, NULL); 
Sigprocmask(SIG SETMASK, &savemask, NULL); 


execl("/bin/sh", "sh", "-c", cmdstring, (char *)0); 
_exit (127); /* exec error */ 
} else { /* parent */ 
while (waitpid(pid, &status, 0) < 0) 
if (errno != EINTR) { 
status = -1; /* error other than EINTR from waitpid() */ 
break; 


} 


/* restore previous signal actions & reset signal mask */ 
if (sigaction(SIGINT, &saveintr, NULL) < 0) 
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return (-1); 

if (sigaction(SIGQUIT, &savequit, NULL) « 0) 
return(-1); 

if (sigprocmask(SIG SETMASK, &savemask, NULL) « 0} 
return(-1); 


return(status); 


} 





如 果 链 接 程序 清单 10-19 与 system 函 数 的 这 一 实现 ， 那 么 所 产生 的 二 进 制 代码 与 上 一 个 有 
缺陷 的 程序 相 比 较 ， 存 在 如 下 差别 : 

(1) 当 我 们 键入 中 断 或 退出 字符 时 ， 不 向 调用 进程 发 送信 号 。 

(2) 当 eaQ 命 令 终止 时 ， 不 向 调用 进程 发 送 SIGCHLD 信 号 。 作 为 替代 ， 在 程序 末尾 的 
sigprocmask 调 用 对 SIGCHLD 信 号 解除 阻塞 之 前 ，SIGCHLD 信 号 一 直 被 阻塞 。 而 对 
sigprocmask 函 数 的 这 一 次 调用 是 在 system 函 数 调用 waitpid 取 到 了 子 进程 的 终止 状态 之 后 。 


POSIX.1 指 出 ， 在 SIGCHLD 未 决 期 间 ， 如 若 wait 或 waitpid 返 回 了 子 进程 的 状态 ， 那 么 SIGCHLD 
信号 不 应 递送 给 该 父 进 程 ， 除 非 另 一 个 子 进程 的 状态 也 可 用 。 本 书 讨论 的 四 种 实现 都 没有 实现 这 种 语 
X. HARK, systems KRHA Twaitpid&, SIGCHLD} X} Ak; 当 解 除了 对 此 信号 的 阻塞 后 ， 
它 被 递送 至 调用 者 。 如 果 我 们 在 程序 清单 10-19 的 sig_chld 函 数 中 调用 wait， 则 它 将 返回 -1， 并 将 
ertno 设 置 为 ECHILD， 因 为 system 西 数 已 取 到 子 进 程 的 终止 状态 。 


很 多 较 早 的 书籍 中 使 用 下 列 程序 段 ， 它 忽略 中 断 和 退出 信号 : 


if ((pid = fork()) < 0) { 
err_sys("fork error"); 
} else if (pid == 0) { 
/* child */ 
execl(...):; 
_exit (127); 


/* parent */ 

old intr = signal(SIGINT, SIG IGN); 

old_quit = signal(SIGQUIT, SIG_IGN); 

waitpid(pid, &status, 0) 

signal (SIGINT, old intr); 

signal (SIGQUIT, old_quit); 
这 段 代码 的 问题 是 : 在 fork 之 后 不 能 保证 父 进程 还 是 子 进程 先 运行 。 如 果子 进程 先 运行 ， 父 
进程 在 一 段 时 间 后 再 运行 ， 那 么 在 父 进程 将 中 断 信号 的 配置 更 改 为 忽略 之 前 ， 就 可 能 产生 这 种 
信号 。 由 于 这 种 原因 ， 程 序 清单 10-20 在 fork 之 前 就 改变 对 该 信号 的 配置 。 

注意 ， 子 进程 在 调用 exec1 之 前 要 先 恢复 这 两 个 信号 的 配置 。 如 同 8.10 节 中 所 说 明 的 一 样 ， 
这 就 允许 在 调用 者 配置 的 基础 上 ，exec1 可 将 它们 的 配置 更 改 为 默认 值 。 口 

system 的 返回 值 

注意 system 的 返回 值 ， 它 是 shell 的 终止 状态 ， 但 shell 的 终止 状态 并 不 总 是 执行 命令 字符 
串 进 程 的 终止 状态 。 程 序 清单 8-13 中 有 一 些 例子 ， 其 结果 正 是 我 们 所 期 望 的 。 如 果 执 行 一 条 如 
date 那 样 的 简单 命令 ， 其 终止 状态 是 0。 执 行 shell 命 令 exit 44， 则 得 终止 状态 44。 在 信号 方 
面 又 如 何 呢 ? 

运行 程序 清单 8-14， 并 向 正在 执行 的 命令 发 送 一 些 信号 : 
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$ tsys "sleep 30* 
^?normal termination, exit status = 130 键 人 中 断 符 
$ tsys "sleep 30° 
“\sh: 946 Quit 


normal termination, 





键 人 退出 符 


exit status = 131 


当 用 中 断 信号 终止 sleep 时 ，pr_exit 函 数 〈 见 程序 清单 8-3) 认为 它 正 常 终止 。 当 用 退 
出 键 杀 死 s1eep 进 程 时 ， 会 发 生 同样 的 事情 。 终 止 状 态 130、131 又 是 怎样 得 到 的 呢 ? 原来 


. Bourne shell 有 一 个 在 其 文档 中 没有 说 清楚 的 特性 ， 其 终止 状态 是 128 加 上 一 个 信号 编号 ， 该 信 


号 终止 了 正在 执行 的 命令 。 用 交互 方式 使 用 shell 可 以 看 到 这 一 点 。 


$ sh 


$ sh -c "sleep 30" 


? 
$ echo $? 
130 


$ sh -c "sleep 30" 
“\sh: 962 Quit - core dumped 键 人 退出 符 


$ echo $? 


确保 运行 Bourne shell 


键 人 中 断 符 
打印 最 后 一 条 命令 的 终止 状态 


打印 最 后 一 条 命令 的 终止 状态 
离开 Bourne shell 


在 所 使 用 的 系统 中 ，SIGINT 的 值 为 2，SIGQUIT 的 值 为 3， 于 是 给 出 shell 终 止 状态 130、131。 
再 试 一 个 类 似 的 例子 ， 这 一 次 将 一 个 信号 直接 送 给 shell， 然 后 观察 system 返 回 什 么 ， 


$ tsys "eleep 30" & 


9257 

$ ps -Ë 
UID 
sar 
sar 
sar 
sar 
sar 


PID PPID 
9260 949 
9258 9257 

949 947 
9257 949 
9259 9258 


$ kill -KILL 9258 


abnormal termination, 


这 一 次 在 后 台 启 动 它 


查看 进程 ID 
TTY TIME CMD 
pts/5 0:00 ps -f 
pts/5 0:00 sh -c sleep 60 
pts/5 0:01 /bin/sh 
pts/5 0:00 tsys sleep 60 
pts/5 0:00 sleep 60 


杀 死 shel 自身 


signal number = 9 


从 中 可 见 仅 当 shell 本 身 异 常 终止 时 ，system 的 返回 值 才 报 告 一 个 异常 终止 。 
在 编写 使 用 system 范 数 的 程序 时 ， 一 定 要 正确 地 解释 返回 值 。 如 果 直 接 调 用 forkx、 
exec 和 wait， 则 终止 状态 与 调用 system 是 不 同 的 。 


10.19 sleep 函 数 


在 本 书 的 很 多 例子 中 都 已 使 用 sheep 函数 ， 在 程序 清单 10-4 和 程序 清单 10-$ 中 有 sleep 的 
两 个 有 缺陷 的 实现 。 


#include <unistd.h> 


unsigned int sleep(unsigned int seconds) ; 


返回 值 : 0 或 未 休眠 够 的 秒 数 





此 函数 使 调用 进程 被 挂 起 ， 直 到 满足 以 下 条 件 之 一 : 

(1) 已 经 过 了 seconds 所 指定 的 墙 上 时 钟 时 间 。 

(2) 调用 进程 捕捉 到 一 个 信号 并 从 信号 处 理 程序 返回 。 

如 辣 alarm 信 号 一 样 ， 由 于 其 他 系统 活动 ， 实 际 返 回 时 间 比 所 要 求 的 会 迟 一 些 。 
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在 第 1 种 情形 中 ， 返 回 值 是 0。 当 由 于 捕捉 到 某 个 信号 sleep 提 早 返回 时 〈 第 2 种 情形 )， 返 


回 值 是 未 睡 够 的 秒 数 (所 要 求 的 时 间 减 去 实际 休眠 时 间 ) 。 


尽管 sL1eep 可 以 用 alarm 国 数 ( 见 10.10 节 ) 实现 ,但 这 并 不 是 必需 的 。 如 果 使 用 alarm， 
则 这 两 个 函数 之 间 可 能 交互 作用 。POSIX.1 标 准 对 这 些 交互 作用 并 未 做 任何 说 明 。 例 如 ， 若 先 
调用 alarm(10)， 过 了 3 秒 后 又 调用 sleep(5)， 那 么 将 如 何 呢 ?sleep 将 在 5 秒 后 返回 (假定 在 
这 段 时 间 内 没有 捕捉 到 另 一 个 信号 ) ， 但 是 否 在 2 秒 后 又 产生 另 一 个 SIGALRM 信 号 呢 ? 这 些 细节 


依赖 于 实现 。 


Solaris 9 用 alarm 实 现 sleep。Solaris 9 sleep(3) 手 册页 中 说 明 以 前 安排 的 闹钟 仍 被 正常 处 理 。 
例如 ,在 前 面 的 例子 中 ， 在 sleep 返 回 之 前 ， 它 安排 在 2 秒 后 再 次 到 达 闹 钟 时 间 。 在 这 种 情况 下 ， 
sleep 返 回 0 (显然 ，sleep 必 须 保 存 SIGALRM 信 号 处 理 程序 的 地 址 ， 并 在 返回 前 复位 它 )。 另 外 ， 如 果 
先 做 一 次 alarm(6) ，3 秒 钟 之 后 又 做 一 次 sleep(5) ， 则 在 3 秒 后 sleep 返 回 (第 一 火 阅 钟 时 间 已 到 )， 
而 不 是 5 秒 钟 。 此 时 ，sleep 的 返回 值 是 未 睡 够 的 时 间 2 秒 。 

FreeBSD 5.2.1, Linux 2.4.22 和 Mac OS X 10.3 则 使 用 另 一 种 技术 : 用 nanosleep(2) 提 供 时 间 迁 迟 。 
TE f cd) Single UNIX Specification 的 实时 扩展 说 明 ， 筷 提供 的 时 间 延 迟 是 高 分 辨 闻 的 。 该 函数 可 以 使 
Sleep 的 实现 与 信号 无 关 。 

考虑 到 可 移植 性 ， 不 应 对 sleep 的 实现 作 任何 假定 ， 但 是 如 果 混 合 调用 sleep 和 其 他 与 计时 有 关 
的 函数 ， 则 需 了 解 它们 之 间 可 能 产生 的 交互 作用 。 


x 例 2 


程序 清单 10-21 是 一 个 POSIX.1 sleep RMA, KAET iS 10-48 fg, EXT 
靠 地 处 理 信号 ， 避 免 了 早期 实现 中 的 竞争 条 件 ， 但 是 仍 未 处 理 与 以 前 设置 的 闹钟 的 交互 作用 


(正如 前 面 提 到 的 ，POSIX.1 并 未 显 式 地 定义 这 些 交 互 作用 ) 。 
程序 清单 10-21 sleep 的 可 靠 实现 


#include "apue.h" 


static void 
sig alrm(int signo) 


/* nothing to do, just returning wakes up sigsuspend() */ 


) 


unsigned int 
sleep (unsigned int nsecs) 


struct sigaction newact, oldact; 
sigset t newmask, oldmask, suspmask; 
unsigned int unslept; 


/* set our handler, save previous information */ 
newact.sa handler - sig alrm; 

Sigemptyset (&newact.sa mask); 

newact.sa flags - 0; 

sigaction(SIGALRM, &newact, &oldact); 


/* block SIGALRM and save current Signal mask */ 


sigemptyset (&newmask) ; 
Sigaddset(&newmask, SIGALRM); 
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sigprocmask (SIG BLOCK, &newmask, &oldmask); 
alarm(nsecs) ; 


suspmask = oldmask; 
sigdelset (&suspmask, SIGALRM); /* make sure SIGALRM isn't blocked */ 
sigsuspend (&suspmask) ; /* wait for any signal to be caught */ 


/* some signal has been caught, SIGALRM is now blocked */ 


unslept = alarm(0); 
sigaction(SIGALRM, &oldact, NULL); /* reset previous action */ 


/* reset signal mask, which unblocks SIGALRM */ 
sigprocmask (SIG_SETMASK, &oldmask, NULL) ; 
return (unslept) ; 


) 


与 程序 清单 10-4 相 比 ， 为 了 可 靠 地 实现 sleep， 程 序 清单 10-21 的 代码 比较 长 。 程 序 中 没有 


使 用 任何 形式 的 非 局 部 转移 〈 如 程序 清单 10-5 为 了 避免 在 alarm 和 pause 之 间 的 竞争 条 件 所 做 
的 那样 )， 所 以 对 处 理 SIGALRM 信 号 期 间 可 能 执行 的 其 他 信号 处 理 程序 没有 任何 影响 。 m 


10.20 ”作业 控制 信号 


在 表 10-1 所 示 的 信号 中 ，POSIX.1 认 为 有 6 个 与 作业 控制 有 关 : 

SIGCHLD “ 子 进 程 已 停止 或 终止。 

SIGCONT ”如 果 进 程 已 停止 ， 则 使 其 继续 运行 。 

SIGSTOP ”停止 信号 (不 能 被 捕捉 或 忽略 ) 。 

SIGTSTP ”交互 式 停止 信号 。 

SIGTTIN 后 台 进 程 组 成 员 读 控制 终端 。 

SIGTTOU 后台 进 程 组 成 员 写 到 控制 终端 。 

除 SIGCHLD 以 外 ， 大 多 数 应 用 程序 并 不 处 理 这 些 信号 ， 交互 式 shel 则 通常 做 处 理 这 些 信和 号 
的 所 有 工作 。 当 键入 挂 起 字符 (通常 是 Ctrl+Z) 时 ，SIGTSTP 被 送 至 前 台 进 程 组 的 所 有 进程 。 
当 我 们 通知 shell 在 前 台 或 后 台 恢复 运行 一 个 作业 时 ，shell 向 该 作业 中 的 所 有 进程 发 送 SIGCONT 
信和 号。 与 此 类 似 ， 如 果 向 一 个 进程 递送 了 SIGTTIN 或 8IGTTOU 信 号 ， 则 根据 系统 默认 的 方式 
停止 此 进程 ， 作 业 控 制 shell 了 解 到 这 一 点 后 就 通知 我 们 。 

一 个 例外 是 管理 终端 的 进程 一 一 例如 ，vi(1) 编 辑 器 。 当 用 户 要 挂 起 它 时 ， 它 需要 能 了 解 
到 这 一 点 ， 这 样 就 能 将 终端 状态 恢复 到 vi 启动 时 的 情况 。 另 外 ， 当 在 前 台 恢复 它 时 ， 它 需要 将 
终端 状态 设置 回 它 所 希望 的 状态 ， 并 需要 重新 绘制 终端 屏幕 。 可 以 在 下 面 的 例子 中 观察 到 与 vi 
类 似 的 程序 是 如 何 处 理 这 种 情况 的 。 

在 作业 控制 信号 间 有 某 种 交互 作用 。 当 对 一 个 进程 产生 四 种 停止 信号 (SIGTSTP, 
SIGSTOP, SIGTTINĘSIGTTOU) 中 的 任意 一 种 时 ， 对 该 进程 的 任 一 未 决 SIGCONT 信 和 号 就 会 
被 丢弃 。 与 此 类 似 ， 当 对 一 个 进程 产生 SITGCONT 信 号 时 ， 对 同一 进程 的 任 一 未 决 停止 信号 将 被 
EF. 

注意 ， 如 果 进 程 是 停止 的 ，STGCONT 的 默认 动作 是 继续 运行 该 进程 ， 否 则 忽略 此 信和 号 。 通 
常 ， 对 该 信号 无 需 做 任何 事情 。 当 对 一 个 停止 的 进程 产生 一 个 SIGCONT 信 号 时 ， 该 进程 就 继续 
运行 ， 即 使 该 信号 是 被 阻塞 或 忽略 的 也 是 如 此 。 
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程序 清单 10-22 例 示 了 当 一 个 程序 处 理 作业 控制 时 所 使 用 的 规范 代码 序列 。 该 程序 只 是 将 其 
标准 输入 复制 到 其 标准 输出 ， 而 在 信号 处 理 程序 中 以 注释 形式 给 出 了 管理 屏幕 的 程序 所 执行 的 
典型 操作 。 当 程序 清单 10-22 启 动 时 ， 仅 当 SIGTSTP 信 号 的 配置 是 SIG_DFL， 它 才 安排 捕 提 该 
信号 。 其 理由 是 : 当 此 程序 由 不 支持 作业 控制 的 shell (例如 /bin/sh) 启动 时 ， 此 信和 号 的 配置 
应 当 设置 为 SIG_IGN。 实 际 上 ，shell 并 不 显 式 地 忽略 此 信和 号， 而 是 由 init 将 这 三 个 作业 控制 
信号 SIGTSTP、SIGTTIN 和 SIGTTOU 设 置 为 SIG_IGN。 然 后 ， 这 种 配置 由 所 有 登录 shell 继 承 。 
只 有 作业 控制 shell 才 应 将 这 三 个 信和 号 复位 为 SIG_DFL。 


程序 清单 10-22 — 如何 处 理 sIGTSTP 





#include "apue.h" 

#define BUFFSIZE 1024 
static void sig tstp(int); 
int 

main(void) 


int n; 

char buf [BUFFSIZE]; 

/* 

* Only catch SIGTSTP if we're running with a job-control shell. 
*/ 

if (signal(SIGTSTP, SIG IGN) == SIG DFL) 


Signal(SIGTSTP, sig tstp); 


while ((n = read(STDIN FILENO, buf, BUFFSIZE)) > 0) 
if (write(STDOUT FILENO, buf, n) !- n) 
err sys("write error"); 


if (n« 0) 
err sys("read error"); 


exit(0); 


Static void 
sig tstp(int signo) /* signal handler for SIGTSTP */ 


sigset t mask; 

/* ... move cursor to lower left corner, reset tty mode ... */ 
/* 

* Unblock SIGTSTP, since it's blocked while we're handling it. 
*/ 


sigemptyset (&mask) ; 
Sigaddset(&mask, SIGTSTP); 
sigprocmask(SIG UNBLOCK, &mask, NULL); 


Signal(SIGTSTP, SIG DFL); /* reset disposition to default */ 
kill(getpid(), SIGTSTP); /* and send the signal to ourself */ 
/* we won't return from the kill until we're continued */ 


Signal(SIGTSTP, sig tstp); /* reestablish signal handler */ 
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/* ... reset tty mode, redraw screen ... */ 


} 


当 键 入 挂 起 字符 时 ， 进 程 接 到 SIGTSTP 信 号 ， 然 后 调用 该 信号 处 理 程序 。 此 时 ， 应 当 进 行 

与 终端 有 关 的 处 理 : 将 光标 移 到 左下 角 ， 恢 复 终端 工作 方式 等 等 。 在 将 SITGTSTP 复 位 为 默认 值 
(停止 该 进程 ) ， 并 且 解 除了 对 此 信号 的 阻塞 之 后 ， 进 程 向 自己 发 送 同 一 信号 SIGTSTP。 因 为 正 

350 在 处 理 STGTSTP 信 号 , 而 在 捕捉 该 信号 期 间 系 统 会 自动 阻塞 它 , 所 以 应 当 解除 对 此 信号 的 阻塞 。 
351] 到 达 这 一 点 时 ， 系 统 停 止 该 进程 。 仅 当 某 个 进程 (通常 是 正 响应 一 个 交互 式 fg 命 令 的 作业 控制 
shell) 向 该 进程 发 送 一 个 SIGCONT 信 号 时 ， 该 进程 才 继 续 。 我 们 不 捕捉 SIGCONT 信 和 号。 该 信 

号 的 默认 配置 是 继续 运行 停止 的 进程 ， 当 此 发 生 时 ， 此 程序 如 同 从 ki11 函 数 返 回 一 样 继续 运 

行 。 当 此 程序 继续 运行 时 ， 将 SIGTSTP 信 号 复位 为 捕捉 ， 并 且 做 我 们 所 希望 做 的 终端 处 理 ( 例 

如 重新 绘制 屏幕 )。 口 


10.21 其 他 特征 


本 节 介 绍 某 些 依赖 于 实现 的 信号 的 其 他 特征 。 
1. 信号 名 字 
某 些 系 统 提供 数组 
extern char *sys siglist[]; 
数组 下 标 是 信号 编号 ， 给 出 一 个 指向 信号 字符 串 名 字 的 指针 。 
FreeBSD 5.2.1, Linux 2.4.22 和 Mac OS X 10.3 都 提供 这 种 信号 名 数组 。Solaris 9 也 ,提供 信号 名 数组 ， 
但 该 数组 名 是 _sys_siglist。 


这 些 系 统 通 常 也 提供 函数 psignal。 


#include <signal.h> 
void psignal (int signo, const char *msg) ; 


字符 串 msg (通常 是 程序 名 ) 输出 到 标准 出 错 文 件 ， 后 接 一 个 冒号 和 一 个 空格 ， 再 接着 对 该 信 
号 的 说 明 ， 最 后 是 一 个 换行 符 。 该 函数 类 似 于 perror (175). 
另 一 个 常用 函数 是 strsignal。 它 类 似 于 strerror (也 见 1.7 节 )。 





#include <string.h> 


char *strsignal (int signo); 





返回 值 : FSR PAS FARRE 


给 出 一 个 信号 编号 ，strsignal 将 返回 说 明 该 售 号 的 字符 串 。 应 用 程序 可 用 该 字符 串 打 印 关 
于 接收 到 信号 的 出 错 消 息 。 


本 书 讨论 的 所 有 平台 都 提供 psignal 和 strsignal 函 数 ， 但 相互 之 间 有 些 差别 。 在 Solaris 9 中 ， 
若 信号 编号 无 效 ， 那 么 ，strsignal 将 返回 一 个 空 指 针 ， 而 FreeBSD 52.1, Linux 2.4.22 和 Mac OS X 
10.3 则 返回 一 个 字符 事 ， 它 指出 信号 编号 是 不 可 识别 的 。 另外， 在 Solaris 中 ， 为 了 得 到 psignal 的 函数 
原型 ， 需 在 程序 中 包括 <siginfo.h>。 
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2. 信号 映射 
Solaris 提 供 一 对 函数 ， 一 个 函数 将 信号 编号 映射 为 信号 名 ， 另 一 个 则 反之 。 
#include «signal.h» 


int sig2str(int signo, char *str); 


int str2sig(const char *str, int *signop); 


两 个 函数 的 返回 值 : 若 成 功 则 返回 0， 若 出 错 则 返回 -1 





在 编写 交互 式 程 序 ， 其 中 需 接 收 和 打印 信号 名 和 编号 时 ， 这 两 个 函数 是 有 用 的 。 
sig2str 函 数 将 给 定 信 号 编号 翻译 成 字符 早 ， 并 将 结果 存放 在 str 指 向 的 存储 区 。 调 用 者 必 
须 保 证 该 存储 区 足够 大 ， 可 以 保存 最 长 的 字符 串 ， 包 括 终止 null 字 节 。Solaris 在 <signal .h> 
中 包含 了 常量 SIG2 STR_MAX， 它 定义 了 最 大 字符 串 长 度 。 该 字符 串 包 括 不 带 “SIG” 前缀 的 信 
号 名 。 例 如 ，SIGKILL 被 翻译 为 字符 串 “KILL”， 并 存放 在 str 指 向 的 存储 缓冲 区 中 。 
str2sig 函 数 将 给 出 的 名 字 翻 译 成 信号 编号 。 该 信号 编号 存放 在 signop 指 向 的 整 型 中 。 名 
字 要 么 是 不 带 “SIG” 前 缀 的 信号 名 ， 要 么 是 表示 十 进 制 信号 编号 的 字符 串 (例如 “9”)。 
注意 ，sig2str 和 str2sig 偏 离 了 一 般 实践 ， 当 它们 失败 时 ， 并 不 设置 errno。 


10.22 小 结 


信号 用 于 大 多 数 复杂 的 应 用 程序 中 。 理 解 进行 信号 处 理 的 原因 和 方式 对 于 高 级 UNIX 编 程 
极其 重要 。 本 章 对 UNIX 信 号 进行 了 详细 而 且 比 较 深 入 的 介绍 。 首 先 说 明了 早期 信号 实施 的 问 
题 以 及 它们 是 如 何 显现 出 来 的 。 然 后 介绍 了 POSIX.1 的 可 靠 信号 概念 以 及 所 有 相关 的 函数 。 在 
此 基础 上 接着 提供 了 abort、system 和 和 sleep 函数 的 POSIX.1 实 现 。 最 后 以 观察 分 析 作 业 控 
制 信号 以 及 信号 名 和 信和 号 编号 之 间 的 转换 结束 。 
习题 

10.1 删除 程序 清单 10-1 中 的 for (; ; ) 语句 ， 结 果 会 怎样 ? 为 什么 ? 

10.2 实现 10-21 节 中 说 明 的 sijg2str 函 数 。 

10.3 和 画 出 运行 程序 清单 10-6 时 的 栈 帧 情况 。 

10.4 程序 清单 10-8 中 利用 setjmp 和 longjmp 设 置 /O 操 作 的 超时 ， 下 面 的 代码 也 常用 于 此 种 
目的 : 


signal (SIGALRM, sig_alrm); 

alarm(60); 

if (setjmp(env_alrm) != 0) { 
/* handle timeout */ 


} 


这 段 代 码 有 什么 错误 ? 

10.5 仅 使 用 一 个 计时 器 (alarm 或 较 高 精度 的 setitimer)， 构 造 一 组 函数 ， 使 得 进程 在 该 
单一 计时 器 基础 上 可 以 设置 任意 数量 的 计时 器 。 

10.6 编写 一 段 程序 测试 程序 清单 10-17 中 父 进程 和 子 进程 的 同步 函数 ， 要 求 进程 创建 一 个 文件 
并 向 文件 写 一 个 整数 0， 然 后 进程 调用 fork ， 接 着 父 进程 和 子 进程 交替 增加 文件 中 的 计 
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数 器 值 ， 每 次 计数 器 值 增 1 时 ， 打 印 是 哪 一 个 进程 〈 子 进程 或 父 进程 ) 进行 了 该 增 1 操 作 。 
在 程序 清单 10-18 所 示 的 函数 中 ， 若 调用 者 捕捉 了 SIGABRT 并 从 该 信号 处 理 程序 中 返回 ， 
为 什么 不 是 仅仅 调用 _exit ， 而 要 复位 其 默认 设置 并 再 次 调用 ki113? 

为 什么 在 siginfo 结 构 ( 见 10.14 节 ) 的 si_uid 字 段 中 包括 实际 用 户 ID 而 非 有 效用 户 ID? 
重 写 程序 清单 10-10 中 的 函数 ， 要 求 它 处 理 表 10-1 中 的 所 有 信和 号 量 ， 每 次 循环 处 理 当 前 信 
号 屏蔽 字 中 的 一 个 信号 量 (并 不 是 对 每 一 个 可 能 的 信号 量 都 循环 一 次 ) 。 

编写 一 段 程序 ， 要 求 在 一 个 无 限 循环 中 调用 sleep(60) 函 数 ， 每 分钟 〈( 即 5 次 循环 ) 取 
当前 的 日 期 和 时 间 ， 并 打印 tm_sec 字 段 。 将 程序 执行 一 晚上 ， 请 解释 其 结果 。 有 些 程 
Æ (如 BSD 中 的 cron 精 灵 进 程 ) 每 分 钟 运行 一 次 ， 它 是 如 何 处 理 这 类 工作 的 ? 

修改 程序 清单 3-3， 要 求 : (a) HEBUFFSIZEBRJjIO0, (b) 用 signal_inttr 国 数 捕捉 
SIGXFSZ 信 和 号 量 并 打印 消息 ， 然 后 从 信号 量 处 理 程 序 中 返回 ，(c) 如 果 没 有 写 满 请 求 的 
字 节 数 ， 则 打印 write 的 返回 值 。 将 软 资源 限制 RKLIMIT_FSIZE ( 见 7.11 节 ) 变 为 1 024 
字 节 (在 shell 中 设置 软 资源 限制 ， 如 果 不 行 就 直接 在 程序 中 调用 setrlimit)， 然 后 复 
制 一 个 大 于 1 024 字 节 的 文件 ， 在 各 种 不 同 的 系统 上 运行 新 程序 ， 其 结果 如 何 ? 为 什么 ? 
编写 一 段 调 用 fwrite 的 程序 ， 它 使 用 一 个 较 大 的 缓冲 区 ( 几 百 睁 )， 在 调用 fwrite 前 
调用 alarm 使 得 一 秒 钟 以 后 产生 信号。 在 信号 处 理 程序 中 打印 捕捉 到 的 信号 ， 然 后 返回 。 
调用 fwrite 可 以 完成 吗 ? 结果 如 何 ? 
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11.1 引言 


在 前 面 的 章节 中 讨论 了 进程 ， 学 习 了 UNIX 进 程 的 环境 、 进 程 间 的 关系 以 及 控制 进程 的 不 
同方 式 。 可 以 看 出 在 相关 的 进程 间 能 够 存在 一 定 的 共享 。 

本 章 将 进一步 深入 考察 进程 ， 了 解 如 何 使 用 多 个 控制 线程 (或 简称 为 线程 ) 在 单 进程 环境 
中 执行 多 个 任务 。 一 个 进程 中 的 所 有 线程 都 可 以 访问 该 进程 的 组 成 部 件 ， 如 文件 描述 符 和 内 存 。 

无 论 何 时 ， 只 要 单个 资源 需要 在 多 个 用 户 间 共享 ， 就 必须 处 理 一 致 性 问题 。 本 章 的 最 后 将 
讨论 目前 可 用 的 同步 机 制 ， 该 机 制 用 以 防止 多 个 线程 查看 到 不 一 致 的 共享 资源 。 


11.2 线程 概念 


典型 的 UNIX 进 程 可 以 看 成 只 有 一 个 控制 线程 : 一 个 进程 在 同一 时 刻 只 做 一 件 事情 。 有 了 
多 个 控制 线程 以 后 ， 在 程序 设计 时 可 以 把 进程 设计 成 在 同一 时 刻 能 够 做 不 止 一 件 事 ， 每 个 线程 
处 理 各 自 独立 的 任务 。 这 种 方法 有 很 多 好 处 。 

* 通过 为 每 种 事件 类 型 的 处 理 分 配 单独 的 线程 ， 能 够 简化 处 理 异步 事件 的 代码 。 每 个 线程 

在 进行 事件 处 理 时 可 以 采用 同步 编程 模式 ， 同 步 编程 模式 要 比 异 步 编程 模式 简单 得 多 。 

* 多 个 进程 必须 使 用 操作 系统 提供 的 复杂 机 制 才 能 实现 内 存 和 文件 描述 符 的 共享 ， 这 方面 

的 内 容 将 在 第 15 章 和 第 17 章 中 学 习 。 而 多 个 线程 自动 地 可 以 访问 相同 的 存储 地 址 空间 和 

文件 描述 符 。 

“有 些 问 题 可 以 通过 将 其 分 解 从 而 改善 整个 程序 的 吞吐 量 。 在 只 有 一 个 控制 线程 的 情况 下 ， 

单个 进程 需要 完成 多 个 任务 时 ， 实 际 上 需要 把 这 些 任务 串 行 化 ， 有 了 多 个 控制 线程 ， 相 

互 独立 的 任务 的 处 理 就 可 以 交叉 进行 ， 只 需要 为 每 个 任务 分 配 一 个 单独 的 线程 ， 当 然 只 

有 在 处 理 过 程 互 不 依赖 的 情况 下 ， 两 个 任务 的 执行 才 可 以 穿插 进行 。 

“交互 的 程序 同样 可 以 通过 使 用 多 线程 实现 响应 时 间 的 改善 ， 多 线程 可 以 把 程序 中 处 理 用 

户 输入 输出 的 部 分 与 其 他 部 分 分 开 。 

有 些 人 把 多 线程 的 程序 设计 与 多 处 理 器 系统 联系 起 来 ， 但 是 即使 程序 运行 在 单 处 理 器 上 ， 
也 能 得 到 多 线程 编程 模型 的 好 处 。 处 理 器 的 数量 并 不 影响 程序 结构 ， 所 以 不 管 处 理 器 的 个 数 是 
多 少 ， 程 序 可 以 通过 使 用 线程 得 以 简化 。 而 且 ， 即 使 多 线程 程序 在 串 行 化 任务 时 不 得 不 阻塞 ， 
由 于 某 些 线程 在 阻塞 的 时 候 还 有 另外 一 些 线程 可 以 运行 ， 所 以 多 线程 程序 在 单 处 理 器 上 运行 仍 
然 能 够 改善 响应 时 间 和 吞吐 量 。 

线程 包含 了 表示 进程 内 执行 环境 必需 的 信息 ， 其 中 包括 进程 中 标识 线程 的 线程 ID 、 一 组 寄 
存 器 值 、 栈 、 调 度 优先 级 和 策略 、 信 号 屏 项 字 、errno 变 量 ( 见 1.7 节 ) 以 及 线程 私有 数据 ( 见 
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12.6 节 )。 进 程 的 所 有 信息 对 该 进程 的 所 有 线程 都 是 共享 的 ， 包 括 可 执行 的 程序 文本 、 程 序 的 全 
局 内 存 和 堆 内 存 、 栈 以 及 文件 描述 符 。 

我 们 将 要 讨论 的 线程 接口 来 自 POSIX.1-2001。 线 程 接口 (也 称 为 “pthread” 或 “POSIX 线 
fe”) 在 POSIX.1-2001 中 是 一 个 可 选 特征 。POSIX 线 程 的 特征 测试 宏 是 _POSIX_THREADS， 应 
用 程序 可 以 把 这 个 宏 用 于 #ifdaef 测 试 ， 以 在 编译 时 确定 是 否 支持 线程 ， 也 可 以 把 _sSC_THREADS 
常数 用 于 调用 sysconf 函 数 ， 从 而 在 运行 时 确定 是 否 支持 线程 。 


11.3 线程 标识 


就 像 每 个 进程 有 一 个 进程 ID 一 样 ， 每 个 线程 也 有 一 个 线程 ID。 进 程 ID 在 整个 系统 中 是 唯一 
的 ， 但 线程 ID 不 同 ， 线 程 ID 只 在 它 所 属 的 进程 环境 中 有 效 。 

回忆 一 下 进程 ID， 它 用 pia_t 数 据 类 型 来 表示 ， 是 一 个 非 负 整 数 。 线 程 ID 则 用 pthread_t 
数据 类 型 来 表示 ， 实 现 的 时 候 可 以 用 一 个 结构 来 代表 pthreadq_t 数 据 类 型 ， 所 以 可 移植 的 操作 
系统 实现 不 能 把 它 作为 整数 处 理 。 因 此 必须 使 用 函数 来 对 两 个 线程 ID 进行 比较 。 


#include «pthread.h» 


int pthread equal(pthread t fidi, pthread t tid2); 
返回 值 : 若 相 等 则 返回 非 0 值 ， 否 则 返回 0 





Linux 2.4.22 使 用 无 符号 长 整 型 数 表示 Pthread 上 数据 类 型 。Solaris 9 把 pthread tg t Jok 3 
KA FH, FreeBSD 5.2.1 和 Mac OS X 10.3 用 一 个 指向 pthread 结 梅 确 指 针 来 表示 Bthread 上 数据 类 型 ， 


用 结构 表示 pthread_t 数 据 类 型 的 后 果 是 不 能 用 一 种 可 移植 的 方式 打印 该 数据 类 型 的 值 。 
在 程序 调试 过 程 中 打印 线程 ID 有 时 是 非常 有 用 的 ， 而 在 其 他 情况 下 通常 不 需要 打印 线程 ID， 因 
此 有 可 能 出 现 不 可 移植 的 调试 代码 ， 当 然 这 也 算 不 上 是 很 大 的 局 限 性 。 

线程 可 以 通过 调用 pthread_self 函 数 获得 自身 的 线程 ID。 


#include <pthread.h> 


pthread_t pthread_self (void); 


返回 值 : 调用 线程 的 线程 ID 


当 线 程 需 要 识别 以 线程 ID 作 为 标识 的 数据 结构 时 ，pthread_self 函 数 可 以 与 
Pthread_equal 函 数 一 起 使 用 。 例 如 ， 主 线程 可 能 把 工作 任务 放 在 一 个 队列 中 ， 用 线程 ID 来 
控制 每 个 工作 线程 处 理 哪些 作业 。 如 图 11-1 所 示 ， 主 线程 把 新 的 作业 放 到 一 个 工作 队列 中 ， 由 
三 个 工作 线程 组 成 的 线程 池 从 队列 中 移出 作业 ， 每 个 线程 并 不 是 任意 地 处 理 从 队列 顶端 取出 的 
作业 ， 而 是 由 主线 程控 制作 业 的 分 配 ， 主 线程 在 每 个 待 处 理 作业 的 结构 中 放置 处 理 该 作业 的 线 
程 也 ， 每 个 工作 线程 只 能 移出 标 有 自己 线程 iD 的 作业 。 


11.4 线程 的 创建 


在 传统 的 UNIX 进 程 模型 中 ， 每 个 进程 只 有 一 个 控制 线程 。 从 概念 上 讲 ， 这 与 基于 线程 的 
模型 中 每 个 进程 只 包含 一 个 线程 是 相同 的 。 在 POSIX 线 程 (pthread) 的 情况 下 ， 程 序 开始 运行 
时 ， 它 也 是 以 单 进程 中 的 单个 控制 线程 启动 的 ， 在 创建 多 个 控制 线程 以 前 ， 程 序 的 行为 与 传统 
的 进程 并 没有 什么 区 别 。 新 增 的 线程 可 以 通过 调用 pthread_create 函 数 创建 。 
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图 11-1 工作 队列 实例 


#include <pthread.h> 


int pthread create(pthread t ‘restrict fidp, 
const pthread attr t *restrict attr, 


void *(*start rin) (void), void *restrict arg); 





返回 值 : 车 成 功 则 返回 0， 否 则 返回 错误 编号 


当 pthread_create 成 功 运 回 时 ， 由 tidp 指 向 的 内 存单 元 被 设置 为 新 创建 线程 的 线程 ID。 
attr 参 数 用 于 定制 各 种 不 同 的 线程 属性 。 线 程 属性 将 在 12.3 节 中 讨论 ， 眼 下 暂时 把 它 设置 为 
NULL， 创 建 默 认 属性 的 线程 。 

新 创建 的 线程 从 start_rin 函 数 的 地 址 开始 运行 ， 该 函数 只 有 一 个 无 类 型 指针 参数 arg， 如 果 
需要 向 start_rtn 函 数 传递 的 参数 不 止 一 个 ， 那 么 需要 把 这 些 参 数 放 到 一 个 结构 中 ， 然 后 把 这 个 
结构 的 地 址 作为 ar8 参 数 传人 。 

线程 创建 时 并 不 能 保证 哪个 线程 会 先 运 行 : 是 新 创建 的 线程 还 是 调用 线程 。 新 创建 的 线程 
可 以 访问 进程 的 地 址 空间 ， 并 且 继 承 调用 线程 的 浮 点 环境 和 信号 屏蔽 字 ， 但 是 该 线程 的 未 决 信 
号 集 被 清除 。 

注意 pthread 函 数 在 调用 失败 时 通常 会 返回 错误 码 ， 它 们 并 不 像 其 他 的 POSIX 函 数 一 样 设 
置 errno。 每 个 线程 都 提供 errno 的 副本 ， 这 只 是 为 了 与 使 用 errnc 的 现 有 函数 兼容 。 在 线程 
中 ， 从 函数 中 返回 错误 码 更 为 清晰 整洁 ， 不 需要 依赖 那些 随 着 函数 执行 不 断 变 化 的 全 局 状态 ， 
因而 可 以 把 错误 的 范围 限制 在 引起 出 错 的 函数 中 。 





更 深入 地 了 解 线 程 是 如 何 工作 的 。 程 序 清单 11-1 中 的 程序 创建 了 一 个 线程 并 且 打 印 进程 ID、 新 
线程 的 线程 ID 以 及 初始 线程 的 线程 ID。 


bbs.theithome.com 


357 


虽然 没有 可 移植 的 方法 打印 线程 ID， 但 是 可 以 写 一 个 小 的 测试 程序 来 完成 这 个 任务 ,以 便 [358] 
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程序 清单 11-1 打印 线程 ID 


#include "apue.h" 
#include <pthread.h> 


pthread t ntid; 

void 

printids(const char *s) 
pid t pid; 
pthread t tid; 


pid = getpid(); 
tid = pthread self(); 
printf ("ts pid su tid u (0x%x)\n", s, (unsigned int) pid, 
(unsigned int)tid, (unsigned int) tid); 
} 


void * 
thr_fn(void *arg) 


printids ("new thread: "); 
return ( (void *)0); 


int 
main (void) 
int err; 


err = pthread_create(&ntid, NULL, thr_fn, NULL); 
if (err != 0) 
err quit("can't create thread: %s\n", strerror(err)); 
printids("main thread:"); 
Sleep(1); 
exit(0); 


) 


这 个 实例 有 两 个 特别 之 处 ， 需 要 处 理 主线 程 和 新 线程 之 间 的 竞争 。( 在 本 章 后 面 的 内 容 中 
将 学 习 如 何 更 好 地 处 理 这 种 竞争 ) 。 首 先是 主线 程 需要 休眠 ， 如 果 主 线程 不 休眠 ， 它 就 可 能 退 
出 ， 这 样 在 新 线程 有 机 会 运行 之 前 整个 进程 可 能 就 已 经 终止 了 。 这 种 行为 特征 依赖 于 操作 系统 
中 的 线程 实现 和 调度 算法 。 

第 二 个 特别 之 处 在 于 新 线程 是 通过 调用 pthread_sel1f 函 数 获取 自己 的 线程 ID， 而 不 是 从 
共享 内 存 中 读 出 或 者 从 线程 的 启动 例 程 中 以 参数 的 形式 接收 到 。 回 忆 pthread_create 函 数 ， 
它 会 通过 第 一 个 参数 (tidp) 返回 新 建 线程 的 线程 ID。 在 本 例 里 ， 主 线程 把 新 线程 ID 存 放 在 
ntid 中 ,但 是 新 建 的 线程 并 不 能 安全 地 使 用 它 ， 如 果 新 线程 在 主线 程 调用 pthread_create 
返回 之 前 就 运行 了 ， 那 么 新 线程 看 到 的 是 未 经 初始 化 的 ntid 的 内 容 ， 这 个 内 容 并 不 是 正确 的 
线程 ID。 

在 Solaris 上 运行 程序 清单 11-1 中 的 程序 ， 得 到 : 

./a.ou 

M aide pid 7225 tid 1 (0x1) 

new thread: pid 7225 tid 4 (0x4) 
正如 所 料 ， 两 个 线程 的 进程 也 相同 ， 但 线程 ID 不 同 。 在 FreeBSD 上 运行 程序 清单 11-1 中 的 程序 ， 
得 到 : 
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$ ./a.out 
main thread: pid 14954 tid 134529024 (0x804c000) 
new thread: pid 14954 tid 134530048 (0x804c400) 


正如 所 料 ， 两 个 线程 有 相同 的 进程 ID ， 如 果 把 线程 ID 看 成 是 十 进 制 整数 ， 线 程 ID 的 值 看 起 来 很 
奇怪 ， 但 是 如 果 把 它们 转化 成 十 六 进 制 ， 就 变 得 有 意义 多 了 。 就 像 前 面 所 提 及 的 ，FreeBSD 使 
用 指向 线程 数据 结构 的 指针 作为 它 的 线程 ID。 

我 们 期 望 Mac OS X 与 FreeBSD 相 似 ， 主 线程 卫 与 新 线程 ID 所 指向 的 内 存单 元 在 相同 的 地 址 
范围 内 ， 但 事实 上 ， 在 Mac OS X 中 ， 主 线程 ID 与 用 pthread_create 新 创建 的 线程 ID 所 指向 
的 内 存单 元 并 不 在 相同 的 地 址 范围 内 : 

$ ./a.out 


main thread: pid 779 tid 2684396012 (0xa000alec) 
new thread: pid 779 tid 25166336 (0x1800200) 


相同 的 程序 在 Linux 上 运行 得 到 的 结果 稍 有 不 同 ; 


$ ./a.out 
new thread: pid 6628 tid 1026 (0x402) 
main thread: pid 6626 tid 1024 (0x400) 


Linux 线 程 ID 看 起 来 更 合理 一 些 ， 但 进程 ID 并 不 匹配 。 这 与 Linux 的 线程 实现 有 关 ，Linux 使 用 
clone 系 统 调用 来 实现 pthread_create。clone 系 统 调用 创建 子 进程 ， 这 个 子 进程 可 以 共 
享 父 进程 一 定数 量 的 执行 环境 (如 文件 描述 符 和 内 存 )， 这 个 数量 是 可 配置 的 。 
另外 还 需要 注意 ， 主 线程 的 输出 基本 上 出 现在 新 建 线程 的 输出 之 前 ， 但 Linux 却 不 是 这 样 
的 ， 所 以 不 能 在 线程 调度 上 做 出 任何 假设 。 口 


11.5 线程 终止 


如 果 进 程 中 的 任 一 线程 调用 了 exit，_Exit 或 者 _exit， 那 么 整个 进程 就 会 终止 。 与 此 
类 似 ， 如 果 信 号 的 默认 动作 是 终止 进程 ， 那 么 ， 把 该 信号 发 送 到 线程 会 终止 整个 进程 (将 在 
12.8 节 中 讨论 信号 与 线程 间 的 交互 ) 。 

单个 线程 可 以 通过 下 列 三 种 方式 退出 ， 在 不 终止 整个 进程 的 情况 下 停止 它 的 控制 流 。 

(1) 线程 只 是 从 启动 例 程 中 返回 ， 返 回 值 是 线程 的 退出 码 。 

(2) 线程 可 以 被 同一 进程 中 的 其 他 线程 取消 。 

(3) 线程 调用 pthread_exit。 


#include <pthread.h> 
void pthread_exit (void *rval_ptr) ; 


rval_ptr 是 一 个 无 类 型 指针 ， 与 传 给 启动 例 程 的 单个 参数 类 似 。 进 程 中 的 其 他 线程 可 以 通过 调用 
pthreadq_join 函 数 访问 到 这 个 指针 。 





#include «pthread.h» 


int pthread join(pthread t thread, void **rval ptr); 


返回 值 : 车 成 功 则 返回 0， 否 则 返回 错误 编号 





调用 线程 将 一 直 阻 塞 ， 直 到 指定 的 线程 调用 pthzead_exit、 从 启动 例 程 中 返回 或 者 被 取消 。 
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如 果 线 程 只 是 从 它 的 启动 例 程 返回 ，rval_ptr 将 包含 返回 码 。 如 果 线 程 被 取消 ， 由 rval_ptr 指 定 
的 内 存单 元 就 置 为 PTHREAD_CANCELED。 

可 以 通过 调用 pthread_join 自 动 把 线程 置 于 分 离 状 态 (马上 就 会 讨论 到 )， 这 样 资源 就 
可 以 恢复 。 如 果 线 程 已 经 处 于 分 离 状 态 ，pthreadq_join 调 用 就 会 失败 ， 返 回 BINVRAL。 

如 果 对 线程 的 返回 值 并 不 感 兴趣 ， 可 以 把 rval_pitr 置 为 NULL。 在 这 种 情况 下 ， 调 用 
pthread_join 洲 数 将 等 待 指 定 的 线程 终止 ， 但 并 不 获取 线程 的 终止 状态 。 


程序 清单 11-2 说 明了 如 何 获取 已 终止 的 线程 的 退出 码 。 
程序 清单 11-2 获得 线程 退出 状态 


#include "apue.h" 
#include <pthread.h> 


void * 

thr fnl (void *arg) 

{ 
printf ("thread 1 returning\n") ; 
return ( (void *)1); 


} 


void * 
thr_fn2(void *arg) 


{ 


printf ("thread 2 exiting\n"); 
pthread exit ((void *)2); 


} 
int 
main (void) 


{ 


int err; 
pthread t tidl, tid2; 
void *tret; 


err = pthread_create(&tid1l, NULL, thr fn1, NULL); 
if (err != 0) 

err quit("can't create thread 1: %s\n", strerror(err)); 
err - pthread create(&tid2, NULL, thr fn2, NULL); 
if (err != 0) 

err quit("can't create thread 2: %s\n", strerror(err)); 
err - pthread join(tidi, &tret); 
if (err !« 0) 

err quit("can't join with thread 1: $s\n", strerror(err)); 
printf ("thread 1 exit code %d\n", (int)tret); 
err - pthread join(tid2, &tret); 


if (err != 0) 

err quit("can't join with thread 2: %s\n", strerror(err)); 
printf ("thread 2 exit code %d\n", (int)tret); 
exit(0); 





运行 程序 清单 11-2 中 的 程序 ， 得 到 的 结果 是 : 


$ ./a.out 
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thread 1 returning 
thread 2 exiting 
thread 1 exit code 1 
thread 2 exit code 2 


可 以 看 出 ， 当 一 个 线程 通过 调用 pthread_exit 退 出 或 者 简单 地 从 启动 例 程 中 返回 时 ， 进 程 中 
的 其 他 线程 可 以 通过 调用 pthread_join 洲 数 获 得 该 线程 的 退出 状态 。 0 


pthread_create 和 pthread_exit 函 数 的 无 类 型 指针 参数 能 传递 的 数值 可 以 不 止 一 个 ， 
该 指针 可 以 传递 包含 更 复杂 信息 的 结构 的 地 址 ， 但 是 注意 这 个 结构 所 使 用 的 内 存在 调用 者 完成 
调用 以 后 必须 仍然 是 有 效 的 ， 否 则 就 会 出 现 无 效 或 非法 内 存 访问 。 例 如 ， 在 调用 线程 的 栈 上 分 
配 了 该 结构 ， 那 么 其 他 的 线程 在 使 用 这 个 结构 时 内 存 内 容 可 能 已 经 改变 了 。 又 如 ， 线 程 在 自己 
的 栈 上 分 配 了 一 个 结构 然后 把 指向 这 个 结构 的 指针 传 给 pthread_exit， 那 么 当 调 用 
pthread_ join 的 线程 试图 使 用 该 结构 时 ， 这 个 栈 有 可 能 已 经 被 撤销 ， 这 块 内 存 也 已 另 作 他 用 。 











程序 清单 11-3 中 的 程序 给 出 了 用 自动 变量 〈 分 配 在 栈 上 ) 作为 pthread_exit 的 参数 时 出 
现 的 问题 。 


程序 清单 11-3 pthread_exit 参 数 的 不 正确 使 用 


#include "apue.h" 
#include <pthread.h> 


struct foo { 
int a, b, c, d; 
) 


void 
printfoo(const char *s, const struct foo *fp) 


printf (s); 

printf(" structure at Ox&x Wn", (unsigned)fp); 
printf(" foo.a = %d\n", fp-»a); 

printf(" foo.b d\n", £p->b); 

printf(" foo.c %d\n", fp-»c); 

printf(" foo.d %d\n", fp-»d); 


} 
void * 
thr_fni(void *arg) 


struct foo foo = {1, 2, 3, 4}; 


printfoo("thread 1:\n", &foo); 
pthread exit((void *)&foo); 


void * 

thr fn2(void *arg) 

{ 
printf ("thread 2: ID is %d\n", pthread self()); 
pthread exit ((void *)0); 

} 

int 

main (void) 
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int err; 
pthread_t tidi, tid2; 
struct foo *fp; 


err = pthread create(&tidl, NULL, thr_fnl, NULL); 
if (err != 0) 

err quit ("can’t create thread 1: $sWMn", strerror(err)); 
err = pthread join(tidl, (void *)&fp); 


if (err !- 0) 
err quit("can't join with thread 1: %s\n", strerror(err)); 
sleep(1); 
363 printf ("parent starting second thread\n"); 
err = pthread create(&tid2, NULL, thr fn2, NULL); 
if (err != 0) 
err quit("can't create thread 2: ts\n", strerror(err)); 
Sleep(1); 
printfoo("parent: Wn", fp); 
exit (0); 


} 
在 Linux 上 运行 此 程序 ， 得 到 


$ ./a.out 
thread 1: 
structure at 0x409a2abc 
foo.a- 1 
foo.b = 2 
foo.c = 3 
foo.d = 4 


parent starting second thread 
thread 2: ID is 32770 


parent: 
Structure at 0x409a2abc 
foo.a = 0 


foo.b = 32770 
foo.c = 1075430560 


foo.d = 1073937284 
当然 ， 运 行 结果 根据 内 存 结构 、 编 译 器 以 及 线程 库 的 实现 会 有 所 不 同 。 在 FreeBSD 上 的 结果 
类 似 于 
$ ./a.out 
thread 1: 
structure at Oxbfafefco 
foo.a = 1 
foo.b = 2 
foo.c = 3 
foo.d = 4 


parent starting second thread 
thread 2: ID is 134534144 


parent: 
structure at Oxbfafefco 
foo.a = 0 
foo.b = 134534144 
foo.c = 3 
foo.d = 671642590 


可 以 看 出 ， 当 主线 程 访问 这 个 结构 时 ， 结 构 的 内 容 (在 线程 tid1 的 栈 上 分 配 ) 已 经 改变 。 注 意 
第 二 个 线程 (tid2) 的 栈 是 如 何 覆盖 第 一 个 线程 的 栈 的 。 为 了 解决 这 个 问题 ， 可 以 使 用 全 局 结 
构 ， 或 者 用 malloc 函 数 分 配 结构 。 D 
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线程 可 以 通过 调用 pthread_cancel 函 数 来 请 求 取 消 同一 进程 中 的 其 他 线程 。 


#include <pthread.h> 


int pthread cancel (pthread t fid); 





返回 值 : 车 成 功 则 返回 0， 否 则 返回 错误 编号 


在 默认 的 情况 下 ，pthread_cancel 函 数 会 使 得 由 fid 标 识 的 线程 的 行为 表现 为 如 同调 用 了 参 
数 为 PTHREAD_CANCELED 的 pthread_exit 函 数 ， 但 是 ， 线 程 可 以 选择 忽略 取消 方式 或 是 控 
制 取消 方式 。 相 关内 容 将 在 12.7 节 中 详细 讨论 。 注 意 pthread_cance1l 并 不 等 待 线程 终止 ， 它 
仅仅 提出 请 求 。 

线程 可 以 安排 它 退 出 时 需要 调用 的 函数 ， 这 与 进程 可 以 用 atexit 函 数 ( 见 7.3 节 ) 安排 进 
程 退 出 时 需要 调用 的 函数 是 类 似 的 。 这 样 的 函数 称 为 线程 清理 处 理 程序 (thread cleanup handler), - 
线程 可 以 建立 多 个 清理 处 理 程 序 。 处 理 程 序 记录 在 栈 中 ， 也 就 是 说 它们 的 执行 顺序 与 它们 注册 
时 的 顺序 相反 。 | 


#include <pthread.h> 


void pthread_cleanup_push(void (*rin) (void *), void *arg); 


void pthread_cleanup_pop(int execute) ; 





当 线 程 执行 以 下 动作 时 调用 清理 函数 , 调用 参数 为 arg， 清 理 函 数 rtm 的 调用 顺序 是 由 
pthread_cleanup_push 国 数 来 安排 的 。 

。 调 用 pthreadq_exit 时 。 

"响应 取消 请 求 时 。 

。 用 非 零 execute 参 数 调用 pthread_cleanup_pop 了 时 。 

如 果 execute 参 数 置 为 0， 清 理 函数 将 不 被 调用 。 无 论 哪 种 情况 ，pthread_cleanup_pop 
都 将 删除 上 次 pthread_cleanup_push 调 用 建立 的 清理 处 理 程序 。 

这 些 函 数 有 一 个 限制 ， 由 于 它们 可 以 实现 为 宏 ， 所 以 必须 在 与 线程 相同 的 作用 域 中 以 匹配 
对 的 形式 使 用 ，pthread_cleanup_push 的 宏 定义 可 包含 字符 {， 在 这 种 情况 下 对 应 的 匹配 
字符 } 就 要 在 pthread_cleanup._pop 定 义 中 出 现 。 









程序 清单 11-4 显 示 了 如 何 使 用 线程 清理 处 理 程序 。 虽 然 例子 有 人 为 编造 之 嫌 ， 但 说 清楚 了 

其 中 涉及 的 清理 机 制 。 注 意 ， 虽 然 并 未 打算 要 传 一 个 非 零 参数 给 线程 启动 例 程 ， 还 是 需要 把 
pthreadq_cleanup_pop 调 用 和 pthread_cleanup_push 调 用 匹配 起 来 ， 否 则 ， 程 序 编译 
可 能 通 不 过 。 

程序 清单 11-4 线程 清理 处 理 程序 


#include "apue.h" 
#include <pthread.h> 


void 
cleanup (void *arg) 


printf ("cleanup: %s\n", (char *) arg); 
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} 


void * 
thr fnl(void *arg) 
{ 
printf ("thread 1 start\n"); 
pthread cleanup push(cleanup, "thread 1 first handler"); 
pthread cleanup push(cleanup, "thread 1 second handler"); 
printf ("thread 1 push complete\n") ; 
if (arg) 
return((void *)1); 
pthread cleanup pop(0); 
pthread cleanup pop (0); 
return((void *)1); 


) 


void * 
thr fn2(void *arg) 
{ 
printf ("thread 2 start\n"); 
pthread cleanup push(cleanup, "thread 2 first handler"); 
pthread cleanup push(cleanup, "thread 2 second handler"); 
printf("thread 2 push complete\n") ; 
if (arg) 
pthread exit((void *)2); 
pthread cleanup pop(0); 
pthread cleanup pop(0); 
pthread exit((void *)2); 


} 
int 
main (void) 


{ 


int err; 
pthread t tidl, tid2; 
void *tret; 


err = pthread create(&tidl, NULL, thr fn1, (void *)1); 
if (err != 0) 

err quit("can't create thread 1: %s\n", strerror(err)); 
err - pthread create(&tid2, NULL, thr fn2, (void *)1); 
if (err != 0) 

err quit("can't create thread 2: %s\n", strerror(err)); 
err - pthread join(tidl, &tret); 
if (err != 0) 

err quit("can't join with thread 1: %s\n", strerror(err)); 
printf("thread 1 exit code %d\n", (int)tret); 
err - pthread join(tid2, &tret); 
if (err != 0) 

err quit("can't join with thread 2: %s\n", strerror(err)); 
printf("thread 2 exit code %d\n", (int)tret); 
exit(0); 





运行 程序 清单 11-4 中 的 程序 会 得 到 ， 


$ ./a.out 

thread 1 start 

thread 1 push complete 
thread 2 start 

thread 2 push complete 
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cleanup: thread 2 second handler 
cleanup: thread 2 first handler 
thread 1 exit code 1 
thread 2 exit code 2 


从 输出 结果 可 以 看 出 ， 两 个 线程 都 正确 地 启动 和 退出 了 ， 但 是 只 调用 了 第 二 个 线程 的 祖 理 
处 理 程序 ， 所 以 如 果 线 程 是 通过 从 它 的 启动 例 程 中 返回 而 终止 的 话 ， 那 么 它 的 清理 处 理 程序 就 
不 会 被 调用 ， 还 要 注意 清理 处 理 程序 是 按照 与 它们 安装 时 相反 的 顺序 被 调用 的 。 口 


现在 可 以 开始 看 出 线程 阳 数 和 进程 函数 之 间 的 相似 之 处 。 表 11-1 总 结 了 这 些 相 似 的 函数 。 
表 11-1 进程 原 语 和 线程 原 语 的 比较 


fork pthread_create 创建 新 的 控制 流 
exit pthread_exit 从 现 有 的 控制 流 中 退出 


waitpid pthread_join 从 控制 流 中 得 到 退出 状态 
atexit pthread_cancel_push 注册 在 退出 控制 流 时 调用 的 函数 
getpid pthread_self 获取 控制 流 的 ID 

abort pthread_cancel 请 求 控制 流 的 非 正 常 进出 


在 默认 情况 下 ， 线 程 的 终止 状态 会 保存 到 对 该 线程 调用 pthread_join， 如 果 线 程 已 经 处 
于 分 离 状态 ， 线 程 的 底层 存储 资源 可 以 在 线程 终止 时 立即 被 收回 。 当 线程 被 分 离 时 ， 并 不 能 用 
pthread_join 函 数 等 待 它 的 终止 状态 。 对 分 离 状 态 的 线程 进行 pthread_join 的 调用 会 产 
Ekik, 返回 EINVAL。pthread_detach 调 用 可 以 用 于 使 线程 进入 分 离 状 态 。 





#include <pthread.h> 


int pthread detach(pthread t fid); 


BA: 车 成 功 则 返回 0， 否 则 返回 错误 编号 





在 下 一 章 中 ， 将 学 习 通过 对 传 给 pthread_create 函 数 的 线程 属性 进行 修改 ， 创 建 一 个 
已 处 于 分 离 状态 的 线程 。 


11.6 线程 同步 


当 多 个 控制 线程 共享 相同 的 内 存 时 ， 需 要 确保 每 个 线程 看 到 一 致 的 数据 视图 。 如 果 每 个 线 
程 使 用 的 变量 都 是 其 他 线程 不 会 读 取 或 修改 的 ， 那 么 就 不 存在 一 致 性 问题 。 同 样 地 ， 如 果 变 量 
是 只 读 的 ， 多 个 线程 同时 读 取 该 变量 也 不 会 有 一 致 性 问题 。 但 是 ， 当 某 个 线程 可 以 修改 变量 ， 
而 其 他 线程 也 可 以 读 取 或 者 修改 这 个 变量 的 时 候 ， 就 需要 对 这 些 线程 进行 同步 ， 以 确保 它们 在 
访问 变量 的 存储 内 容 时 不 会 访问 到 无 效 的 数值 。 

当 一 个 线程 修改 变量 时 ， 其 他 线程 在 读 取 这 个 变量 的 值 时 就 可 能 会 看 到 不 一 致 的 数据 。 在 
变量 修改 时 间 多 于 一 个 存储 器 访问 周期 的 处 理 器 结构 中 ， 当 存储 器 读 与 存储 器 写 这 两 个 周期 交 
又 时 ， 这 种 潜在 的 不 一 致 性 就 会 出 现 。 当 然 ， 这 种 行为 是 与 处 理 器 结构 相关 的 ， 但 是 可 移植 的 
程序 并 不 能 对 使 用 何 种 处 理 器 结构 做 出 假设 。 

图 11-2 描 述 了 两 个 线程 读 写 相 同 变 量 的 假设 例子 。 在 这 个 例子 中 ， 线 程 A 读 取 变 量 然 后 给 
这 个 变量 赋予 一 个 新 的 值 ， 但 写 操作 需要 两 个 存储 器 周期 。 当 线程 B 在 这 两 个 存储 器 写 周期 中 
间 读 取 这 个 相同 的 变量 时 ， 它 就 会 得 到 不 一 致 的 值 。 
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为 了 解决 这 个 问题 ， 线 程 不 得 不 使 用 锁 ， 在 同一 时 间 只 允许 一 个 线程 访问 该 变量 。 图 11-3 
[B68] 描述 了 这 种 同步 。 如 果 线 程 B 希 望 读 取 变量 ， 它 首先 要 获取 锁 ， 同 样 地 ， 当 线程 A 更 新 变量 时 ， 
也 需要 获取 这 把 同样 的 锁 。 因 而 线程 B 在 线程 A 释放 锁 以 前 不 能 读 取 变 量 。 


线程 A 线程 B 


线程 A 线程 B 








时 间 


图 11-2 两 个 线程 的 交叉 存储 器 周期 





图 11-3 两 个 线程 同步 内 存 访 问 


当 两 个 或 多 个 线程 试图 在 同一 时 间 修 改 同一 变量 时 ， 也 需要 进行 同步 。 考 虑 变量 递增 操作 
的 情况 〈 图 11-4) ， 增 量 操作 通常 可 分 为 三 步 : 











(1) 从 内 存单 元 读 入 寄存 器 。 
(2) 在 寄存 器 中 进行 变量 值 的 增加 。 
(3) 把 新 的 值 写 回 内 存单 元 。 
线程 A 线程 B i 的 内 容 
读 取 i 放 入 寄存 器 5 
(register = 5) 
寄存 器 内 容 加 1 读 取 i 攻 入 寄存 器 
; 5 
(register = 6) (register = 5) 
时 间 
把 寄存 器 
WASH pieno 6 
(register= 6) RARUS 
| 把 寄存 器 
内 容 写 回 i 6 


(register = 6) 


图 11-4 两 个 非 同步 的 线程 对 同一 个 变量 做 增 量 操作 
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如 果 两 个 线程 试图 在 几乎 同一 时 间 对 同一 个 变量 做 增 量 操作 而 不 进行 同步 的 话 ， 结 果 就 可 
能 出 现 不 一 致 。 变 量 可 能 比 原来 增加 了 1， 也 有 可 能 比 原来 增加 了 2， 具 体 是 1 还 是 2 取决 于 第 二 
个 线程 开始 操作 时 获取 的 数值 。 如 果 第 二 个 线程 执行 第 一 步 要 比 第 一 个 线程 执行 第 三 步 早 ， 第 
二 个 线程 读 到 的 初始 值 就 与 第 一 个 线程 一 样 ， 它 为 变量 加 1， 然 后 再 写 回 去 ， 事 实 上 没有 实际 
的 效果 ， 总 的 来 说 变量 只 增加 了 1。 

如 果 修 改 操作 是 原子 操作 ， 那 么 就 不 存在 竞争 。 在 前 面 的 例子 中 ， 如 果 增 加 1 只 需要 一 个 
存储 器 周期 ， 那 么 就 没有 竞争 存在 。 如 果 数 据 总 是 以 顺序 一 致 的 方式 出 现 ， 就 不 需要 额外 的 同 
步 。 当 多 个 线程 并 不 能 观察 到 数据 的 不 一 致 时 ， 那 么 操作 就 是 顺序 一 致 的 。 在 现代 计算 机 系统 
中 ， 存 储 器 访问 需要 多 个 总 线 周期 ， 多 处 理 器 的 总 线 周 期 通常 在 多 个 处 理 器 上 是 交叉 的 ， 所 以 
无 法 保证 数据 是 顺序 一 致 的 。 | 

在 顺序 一 致 的 环境 中 ， 可 以 把 数据 修改 操作 解释 为 运行 线程 的 顺序 操作 步骤 。 可 以 把 这 样 
的 情形 描述 为 “线程 A 对 变量 增加 了 1, 然后 线程 B 对 变量 增加 了 1, 所 以 变量 的 值 比 原来 的 大 2”， 
或 者 描述 为 “线程 B 对 变量 增加 了 1， 然 后 线程 A 对 变量 增加 了 1， 所 以 变量 的 值 比 原来 的 大 2”。 
这 两 个 线程 的 任何 操作 顺序 都 不 可 能 让 变量 出 现 除了 上 述 值 以 外 的 其 他 数值 。 

除了 计算 机 体系 结构 的 因素 以 外 ， 程 序 使 用 变量 的 方式 也 会 引起 竞争 ， 也 会 导致 不 一 致 的 
情况 发 生 。 例 如 ， 可 能 会 对 某 个 变量 加 1， 然 后 基于 这 个 数值 做 出 某 种 决定 。 增 量 操作 这 一 步 
和 做 出 决定 这 一 步 两 者 的 组 合并 非 原子 操作 ， 因 而 给 不 一 致 情况 的 出 现 提供 了 可 能 。 

1. ERE 

可 以 通过 使 用 pthread 的 互 斥 接口 保护 数据 ， 确 保 同 一 时 间 只 有 一 个 线程 访问 数据 。 互 穆 
量 (mutex) 从 本 质 上 说 是 一 把 锁 ， 在 访问 共享 资源 前 对 互 斥 量 进行 加 锁 ， 在 访问 完成 后 释放 
互 斥 量 上 的 锁 。 对 互 斥 量 进行 加 锁 以 后 ， 任 何其 他 试图 再 次 对 互 斥 量 加 锁 的 线程 将 会 被 阻塞 直 
到 当前 线程 释放 该 互 斥 锁 。 如 果 释 放 互 斥 锁 时 有 多 个 线程 阻塞 ， 所 有 在 该 互 斥 锁 上 的 阻塞 线程 
都 会 变 成 可 运行 状态 ， 第 一 个 变 为 运行 状态 的 线程 可 以 对 互 斥 量 加 锁 ， 其 他 线程 将 会 看 到 互 斥 
锁 依 然 被 锁 住 ， 只 能 回去 再 次 等 待 它 重新 变 为 可 用 。 在 这 种 方式 下 ， 每 次 只 有 一 个 线程 可 以 
向 前 执行 。 

在 设计 时 需要 规定 所 有 的 线程 必须 遵守 相同 的 数据 访问 规则 ， 只 有 这 样 ， 互 斥 机 制 才能 正 
常 工作 。 操 作 系 统 并 不 会 做 数据 访问 的 串 行 化 。 如 果 人 允许 其 中 的 某 个 线程 在 没有 得 到 锁 的 情况 
下 也 可 以 访问 共享 资源 ， 那 么 即使 其 他 的 线程 在 使 用 共享 资源 前 都 获取 了 锁 ， 也 还 是 会 出 现 数 
据 不 一 致 的 问题 。 

互 斥 变量 用 pthread_mutex_t 数 据 类 型 来 表示 ， 在 使 用 互 斥 变量 以 前 ， 必 须 首先 对 它 进 
行 初始 化 ， 可 以 把 它 置 为 常量 PTHREAD_MUTEX_INITIALIZER (只 对 静态 分 配 的 互 斥 量 ) ， 
也 可 以 通过 调用 pthread_mutex_init 函 数 进行 初始 化 。 如 果 动 态 地 分 配 互 斥 量 (例如 通过 
调用 malloc 函 数 )， 那 么 在 释放 内 存 前 需要 调用 pthread_mutex_destroy。 


#include <pthread.h> 


int pthread mutex init (pthread_mutex_t *restrict mutex, 


const pthread mutexattr t *restrict attr); 





int pthread mutex destroy (pthread_mutex_t *mutex) ; 


返回 值 ， 若 成 功 则 返回 9， 否 则 返回 错误 编号 


要 用 默认 的 属性 初始 化 互 斥 量 ， 只 需 把 attr 设 置 为 NULL。 非 默认 的 互 斥 量 属性 将 在 12.4 节 中 
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讨论 。 
对 互 斥 量 进行 加 锁 ， 需 要 调用 pthreaqd_mutex_lock， 如 果 互 斥 量 已 经 上 锁 ， 调 用 线程 
将 阻塞 直到 互 斥 量 被 解锁 。 对 互 斥 量 解锁 ， 需 要 调用 pthread_mutex_unlock。 


#include <pthread.h> 


int pthread_mutex_lock(pthread_mutex_t *mutex) ; 


int pthread_mutex_trylock (pthread_mutex_t *multex) ; 


int pthread mutex unlock(pthread mutex t *mulex); 


BAB: 车 成 功 则 返回 0， 否 则 返回 错误 编号 





如 果 线 程 不 希望 被 阻塞 ， 它 可 以 使 用 pthread_mutex_trylock 尝 试 对 互 斥 量 进行 加 锁 。 
如 果 调 用 pthread_mutex_trylock 时 互 斥 量 处 于 未 锁 住 状态 ， 那 么 pthread_mutex_ 
trylock 将 锁 住 互 斥 量 ， 不 会 出 现 阻塞 并 返回 9， 否 则 pthread_mutex_trylock 就 会 失败 ， 不 
能 锁 住 互 斥 量 ， 而 返回 EBUSY。 : 





程序 清单 11-5 描 述 了 用 于 保护 某 个 数据 结构 的 互 斥 量 。 当 多 个 线程 需要 访问 动态 分 配 的 对 
象 时 ， 可 以 在 对 象 中 嵌入 引用 计数 ， 确 保 在 所 有 使 用 该 对 象 的 线程 完成 数据 访问 之 前 ， 该 对 象 
内 存 空间 不 会 被 释放 。 


程序 清单 11-5 使 用 互 斥 量 保护 数据 结构 


#include <stdlib.h> 
#include «pthread.h» 


struct foo { 


int f count; 
pthread mutex t t£ lock; 
/* ... more stuff here ... */ 


) 


struct foo * 
foo alloc(void) /* allocate the object */ 


struct foo *fp; 


if ((fp = malloc(sizeof(struct foo))) != NULL) { 
fp->f count = 1; 
if (pthread mutex init(&fp-»f lock, NULL) != 0) { 
free (fp); 


return (NULL) ; 
/* ... continue initialization ... */ 


return (fp) ; 


void 
foo_hold(struct foo *fp) /* add a reference to the object */ 


{ 
pthread mutex lock(&fp-»f lock); 
fp->f_count++; 
pthread mutex unlock(&fp-»f lock); 
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} 


void 
foo_rele(struct foo *fp) /* release a reference to the object */ 


pthread mutex lock(&fp-»f lock); 

if (--fp-»f count -- 0) ( /* last reference */ 
pthread mutex unlock(&fp-»f lock); 
pthread mutex destroy(&fp-»f lock); 
free(fp); 

} eise { 
pthread mutex unlock(&fp-»f lock); 

) 

) 


在 对 引用 计数 加 1、 减 1 以 及 检查 引用 计数 是 否 为 0 这 些 操作 之 前 需要 锁 住 互 斥 量 。 在 
£00_alloc 函 数 将 引用 计数 初始 化 为 1 时 没 必要 加 锁 ， 因 为 在 这 个 操作 之 前 分 配 线程 是 唯一 引 
用 该 对 象 的 线程 。 但 是 在 这 之 后 如 果 要 将 该 对 象 放 到 一 个 列表 中 ， 那 么 它 就 有 可 能 被 别 的 线程 
发 现 ， 因 此 需要 首先 对 它 加 锁 。 

在 使 用 该 对 象 前 ， 线 程 需要 对 这 个 对 象 的 引用 计数 加 1， 当 对 象 使 用 完毕 时 ， 需 要 对 引用 
计数 减 1。 当 最 后 一 个 引用 被 释放 时 ， 对 象 所 占 的 内 存 空间 就 被 释放 。 口 


2. 避免 死 锁 

如 果 线 程 试图 对 同一 个 互 斥 量 加 锁 两 次 ， 那 么 它 自身 就 会 陷入 死 锁 状 态 ， 使 用 互 斥 量 时 ， 
还 有 其 他 更 不 明显 的 方式 也 能 产生 死 锁 。 例 如 ， 程 序 中 使 用 多 个 互 斥 量 时 ， 如 果 人 允许 一 个 线程 
一 直 占有 第 一 个 互 斥 量 ， 并 且 在 试图 锁 住 第 二 个 互 斥 量 时 处 于 阻塞 状态 ， 但 是 拥有 第 二 个 互 斥 
量 的 线程 也 在 试图 锁 住 第 一 个 互 斥 量 ， 这 时 就 会 发 生死 锁 。 因 为 两 个 线程 都 在 相互 请 求 另 一 个 
线程 拥有 的 资源 ,. 所 以 这 两 个 线程 都 无 法 向 前 运行 ， 于 是 就 产生 死 锁 。 

可 以 通过 小 心地 控制 互 斥 量 加 锁 的 顺序 来 避免 死 锁 的 发 生 。 例 如 ， 假 设 需要 对 两 个 互 斥 量 
A 和 B 同 时 加 锁 ， 如 果 所 有 线程 总 是 在 对 互 斥 量 B 加 锁 之 前 锁 住 互 斥 量 A， 那 么 使 用 这 两 个 互 斥 
量 不 会 产生 死 锁 (当然 在 其 他 的 资源 上 仍 可 能 出 现 死 锁 ) ， 类 似 地 ， 如 果 所 有 的 线程 总 是 在 锁 
住 互 斥 量 A 之 前 锁 住 互 斥 量 B， 那 么 也 不 会 发 生死 锁 。 只 有 在 一 个 线程 试图 以 与 另 一 个 线程 相 
反 的 顺序 锁 住 互 斥 量 时 ， 才 可 能 出 现 死 锁 。 

有 时 候 应 用 程序 的 结构 使 得 对 互 斥 量 加 锁 进 行 排序 是 很 困难 的 ， 如 果 涉 及 了 太 多 的 锁 和 数 
据 结构 ， 可 用 的 函数 并 不 能 把 它 转换 成 简单 的 层次 ， 那 么 就 需要 采用 另外 的 方法 。 可 以 先 释 
放 占 有 的 锁 ， 然 后 过 一 段 时 间 再 试 。 这 种 情况 可 以 使 用 pthread_mutex_trylock 接 口 避免 
死 锁 。 如 果 已 经 占有 某 些 锁 而 且 pthreada_mutex_trylock 接 口 返回 成 功 ， 那 么 就 可 以 前 
进 ; 但 是 ， 如 果 不 能 获取 锁 ， 可 以 先 释 放 已 经 占有 的 锁 ， 做 好 清理 工作 ， 然 后 过 一 段 时 间 重 
PAR, 








在 这 个 例子 中 ， 我 们 修改 了 程序 清单 11-5， 用 以 描述 两 个 互 斥 量 的 使 用 方法 ( 见 程序 清单 
11-6)。 当 同时 需要 两 个 互 斥 量 时 ， 总 是 让 它们 以 相同 的 顺序 加 锁 ， 以 避免 死 锁 。 第 二 个 互 斥 量 
维护 着 一 个 用 于 跟踪 foo 数 据 结 构 的 散 列 列表 。 这 样 hashlock 互 斥 量 保护 fooc 数 据 结构 中 的 
fh 散 列表 和 f_next 散 列 链 字段 。foco 结 构 中 的 E_lock 互 斥 量 保护 对 foo 结 构 中 的 其 他 字段 
的 访问 。 
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程序 清单 11-6 使 用 两 个 互 斥 量 





#include <stdlib.h> 
#include <pthread.h> 


#define NHASH 29 

#define HASH (fp) (((unsigned long) fp) ‘NHASH) 

struct foo *fh[NHASH]; 

pthread_mutex_t hashlock = PTHREAD MUTEX_INITIALIZER; 


struct foo { 


int f count; 

pthread mutex t f lock; 

Struct foo *f next; /* protected by hashlock */ 
int f id; 

/* ... more stuff here ... */ 


) 


struct foo * 
foo alloc(void) /* allocate the object */ 
( 

struct foo *fp; 

int idx; 


if ((fp = malloc(sizeof(struct foo))) !- NULL) { 
fp-»f count = 1; 
if (pthread mutex init(&fp-»f lock, NULL) != 0) { 
free(fp); 
return (NULL); 
) 
idx - HASH(fp); 
pthread mutex lock(&hashlock); 
fp-»f next = fh[idx]; 
fh[idx] = fp-»f next; 
pthread mutex lock(&fp-»f lock); 
pthread mutex unlock (&hashlock) ; 
/* ... continue initialization ... */ 
pthread mutex unlock(&fp-»f lock); 
) 


return(fp); 


) 


void 
foo hold(struct foo *fp) /* add a reference to the object */ 
{ 

pthread mutex lock(&fp-»f lock); 

fp->f_count++; 

pthread mutex unlock(&fp-»f lock); 


} 


struct foo * 
foo find(int id) /* find an existing object */ 
{ 

struct foo *fp; 

int idx; 


idx = HASH (fp); 

pthread mutex lock(&hashlock); 

for (fp = fh[idx]; fp != NULL; fp = fp-»f next) { 
if (fp-»f id == id) { 
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foo_hold (fp); 
break; 
} 
} 
pthread mutex unlock (&hashlock); 
return(fp); 


) 


void 
foo rele(struct foo *fp) /* release a reference to the object */ 


struct foo *tfp; 
int idx; 


pthread mutex lock(&fp-»f lock); 
if (fp-»f count == 1) { /* last reference */ 
pthread mutex unlock(&fp-»f£ lock); 
pthread mutex lock(&hashlock); 
pthread mutex lock(&fp-»f lock); 
/* need to recheck the condition */ 
if (fp-»f count != 1) { 
fp-»f count--; 
pthread mutex unlock(&fp-»f lock); 
pthread mutex unlock (&hashlock) ; 
return; 
) 
/* remove from list */ 
idx = HASH(fp); 
tfp = fh[idx]; 
if (tfp == fp) { 
fh[idx] = fp-»f next; 
} eise { 
while (tfp->f_next != fp) 
tfp = tfp-»f next; 
tfp-»f next = fp-»f next; 
) 
pthread mutex unlock (&hashlock) ; 
pthread mutex unlock(&fp-»f lock); 
pthread mutex destroy(&fp-»f lock); 
free(fp); 
} else { 
fp-»f count--; 
pthread mutex unlock(&fp-»f lock); 
) 
) 


比较 程序 清单 11-6 和 程序 清单 11-5， 可 以 看 出 分 配 国 数 现在 锁 住 散 列 列表 锁 ， 把 新 的 结构 
添加 到 散 列 存 储 桶 中 ， 在 对 散 列 列表 的 锁 解 锁 之 前 ， 先 锁 住 新 结构 中 的 互 斥 量 。 因 为 新 的 结构 
是 放 在 全 局 列表 中 的 ， 其 他 线程 可 以 找到 它 ， 所 以 在 完成 初始 化 之 前 ， 需 要 阻塞 其 他 试图 访问 
新 结构 的 线程 。 

foo_find 函 数 锁 住 散 列 列表 锁 然 后 搜索 被 请 求 的 结构 。 如 果 找 到 了 ， 就 增加 其 引用 计数 
并 返回 指向 该 结构 的 指针 。 注 意 加 锁 的 顺序 是 先 在 foo_find 函 数 中 锁定 散 列 列表 锁 ， 然 后 再 
在 foo_hold 函 数 中 锁定 foo 结 构 中 的 f_lock 互 斥 量 。 

现在 有 了 两 个 锁 以 后 ，foo_rele 函 数 变 得 更 加 复杂 。 如 果 这 是 最 后 一 个 引用 ， 因 为 将 需 
要 从 散 列 列表 中 删除 这 个 结构 ， 就 要 先 对 这 个 结构 互 斥 量 进行 解锁 ， 才 可 以 获取 散 列 列表 锁 。 
然后 重新 获取 结构 互 斥 量 。 从 上 一 次 获得 结构 互 斥 量 以 来 可 能 处 于 被 阻塞 状态 ， 所 以 需要 重新 
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检查 条 件 ， 判 断 是 否 还 需要 释放 这 个 结构 。 如 果 其 他 线程 在 我 们 为 满足 锁 顺 序 而 阻塞 时 发 现 了 
这 个 结构 并 对 其 引用 计数 加 1， 那 么 只 需要 简单 地 对 引用 计数 减 1， 对 所 有 的 东西 解锁 然后 返回 。 

如 此 加 、 解 锁 太 复杂 ， 所 以 需要 重新 审视 原来 的 设计 。 也 可 以 使 用 散 列 列 表 锁 来 保护 结构 
引用 计数 ， 使 事情 大 大 简化 ， 结 构 互 斥 量 可 以 用 于 保护 fco 结 构 中 的 其 他 任何 东西 。 程 序 清单 
11-7 反 应 了 这 种 变化 。 


程序 清单 11-7 简化 的 加 、 解 锁 


#include <stdlib.h> 
#include <pthread.h> 


#define NHASH 29 
#define HASH(fp) (((unsigned long) fp) $NHASH) 


struct foo *fh[NHASH]; 
pthread mutex t hashlock - PTHREAD MUTEX INITIALIZER; 


struct foo ( 


int f count; /* protected by hashlock */ 
pthread mutex t f lock; 

struct foo *f next; /* protected by hashlock */ 
int f id; 

/* ... more stuff here ... */ 


) 


struct foo * 
foo alloc(void) /* allocate the object */ 
( 

struct foo *fp; 

int idx; 


if ((fp = malloc (sizeof (struct foo))) != NULL) { 
fp-»f count = 1; 


if (pthread_mutex_init(&fp->f_lock, NULL) != 0) { 
free (fp); 
return (NULL) ; 

} 


idx = HASH(fp); 

pthread_mutex_lock (&hashlock) ; 
fp->f_next = fh[idx]; 

fh[idx] = fp->f next; 

pthread mutex lock(&fp-»f lock); 
pthread mutex unlock(&hashlock); 

/* ... continue initialization ... */ 


return(fp); 


) 


void 
foo hold(struct foo *fp) /* add a reference to the object */ 
{ 

pthread mutex lock(&hashlock); 

fp->f_count++; 

pthread_mutex_unlock (&hashlock) ; 


} 


struct foo * 
foo_find(int id) /* find a existing object */ 


{ 
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struct foo *fp; 
int idx; 
idx - HASH(fp); 
pthread mutex lock (&hashlock) ; 
for (fp = fh[idx]l; fp !- NULL; fp = fp-»f next) { 
if (fp-»f id == id) { : 
fp->f_count++; 
break; 
} 
} 
pthread mutex unlock(&hashlock); 
return(fp); 


) 
void 
foo rele(struct foo *fp) /* release a reference to the object */ 
struct foo *tfp; 
int idx; 
pthread_mutex_lock (&hashlock) ; 
if (--fp->f_count == 0) { /* last reference, remove from list */ 
idx = HASH(fp); 
if (tfp == fp) { 
fh[idx] = fp->f_next; 
} else { 
while (tfp-»f next != fp) 
tip = tfp-»f next; 
tfp-»f next = fp-»f next; 
) 
pthread mutex unlock (&hashlock) ; 
pthread mutex destroy (&fp-»f lock); 
free (fp); 
) else { . 
pthread mutex unlock (&hashlock) ; 


) 
en EL 

注意 ， 与 程序 清单 11-6 中 的 程序 相 比 ， 程 序 清单 11-7 中 的 程序 简单 得 多 。 两 种 用 途 使 用 相同 的 
锁 时 ， 围 绕 散 列 列表 和 引用 计数 的 锁 的 排序 问题 就 随 之 不 见 了 。 多 线程 的 软件 设计 经 常 要 考虑 这 
类 折 中 处 理 方案 。 如 果 锁 的 粒度 太 粗 ， 就 会 出 现 很 多 线程 阻塞 等 待 相同 的 锁 ， 源 自 并 发 性 的 改善 
微乎其微 。 如 果 锁 的 粒度 太 细 ， 那 么 过 多 的 锁 开销 会 使 系统 性 能 受到 影响 ， 而 且 代码 变 得 相当 复 
杂 。 作 为 一 个 程序 员 ， 需 要 在 满足 锁 需 求 的 情况 下 ， 在 代码 复杂 性 和 优化 性 能 之 间 找 好 平衡 点 。 口 

3. 读 写 锁 

读 写 锁 与 互 斥 量 类 似 ， 不 过 读 写 锁 允 许 更 高 的 并 行 性 。 互 斥 量 要 么 是 锁 住 状态 要 么 是 不 加 
锁 状 态 ， 而 且 一 次 只 有 一 个 线程 可 以 对 其 加 锁 。 读 写 锁 可 以 有 三 种 状态 ， 读 模式 下 加 锁 状 态 ， 
写 模式 下 加 锁 状 态 ， 不 加 锁 状态 。 一 次 只 有 一 个 线程 可 以 占有 写 模 式 的 读 写 锁 ， 但 是 多 个 线程 
可 以 同时 占有 读 模式 的 读 写 锁 。 

当 读 写 锁 是 写 加 锁 状 态 时 ， 在 这 个 锁 被 解锁 之 前 ， 所 有 试图 对 这 个 锁 加 锁 的 线程 都 会 被 阻 
塞 。 当 读 写 锁 在 读 加 锁 状 态 时 ， 所 有 试图 以 读 模式 对 它 进行 加 锁 的 线程 都 可 以 得 到 访问 权 ， 但 
是 如 果 线 程 希望 以 写 模式 对 此 锁 进行 加 锁 ， 它 必须 阻塞 直到 所 有 的 线程 释放 读 锁 。 虽 然 读 写 锁 
的 实现 各 不 相同 ， 但 当 读 写 锁 处 于 读 模式 锁 住 状态 时 ， 如 果 有 另外 的 线程 试图 以 写 模 式 加 锁 ， 


bbs.theithome.com 








306 第 ll 章 线 3d 


读 写 锁 通 常会 阻塞 随后 的 读 模式 锁 清 求 。 这 样 可 以 避免 读 模式 锁 长 期 占用 ， 而 等 待 的 写 模式 锁 
请 求 一 直 得 不 到 满足 。 

读 写 锁 非 常 适合 于 对 数据 结构 读 的 次 数 远大 于 写 的 情况 。 当 读 写 锁 在 写 模式 下 时 ， 它 所 保 
护 的 数据 结构 就 可 以 被 安全 地 修改 ， 因 为 当前 只 有 一 个 线程 可 以 在 写 模式 下 拥有 这 个 锁 。 当 读 
写 锁 在 读 模式 下 时 ， 只 要 线程 获取 了 读 模 式 下 的 读 写 锁 ， 该 锁 所 保护 的 数据 结构 可 以 被 多 个 获 
得 读 模 式 锁 的 线程 读 取 。 

读 写 锁 也 叫做 共享 -独占 锁 ， 当 读 写 锁 以 读 模 式 锁 住 时 ， 它 是 以 共享 模式 锁 住 的 ， 当 它 以 
写 模式 锁 住 时 ， 它 是 以 独占 模式 锁 住 的 。 

与 互 斥 量 一 样 ， 读 写 锁 在 使 用 之 前 必须 初始 化 ， 在 释放 它们 底层 的 内 存 前 必须 销毁 。 


#include <pthread.h> 


int pthread_rwlock_init (pthread_rwlock_t *restrict rwlock, 
const pthread rwlockattr t *restrict attr); 


int pthread rwlock destroy(pthread rwlock t *rwlock); 


两 者 的 返回 值 都 是 : 若 成 功 则 返回 0， 否 则 返回 错误 编号 





读 写 锁 通过 调用 pthread_rwlock_init 进 行 初始 化 。 如 果 和 希望 读 写 锁 有 默认 的 属性 ， 可 以 
传 一 个 空 指针 给 attr， 读 写 锁 的 属性 将 在 12.4 节 中 讨论 。 

在 释放 读 写 锁 占 用 的 内 存 之 前 ， 需 要 调用 pthread_rwlock_destroy 做 清理 工作 。 如 果 
pthread_rwlock_init 为 读 写 锁 分 配 了 资源 ，pthread_rwlock_destroy 将 释放 这 些 资 
源 。 如 果 在 调用 pthread_rwlock_destroy 之 前 就 释放 了 读 写 锁 占用 的 内 存 空间 ， 那 么 分 配 
给 这 个 锁 的 资源 就 丢失 了 。 

要 在 读 模 式 下 锁定 读 写 锁 ， 需 要 调用 pthread_rwlock_rdlock， 要 在 写 模式 下 锁定 读 写 
锁 ， 需 要 调用 pthread_rwlock_wrlock。 不 管 以 何 种 方式 锁 住 读 写 锁 ， 都 可 以 调用 pthread_. 
rwlock_unlock 进 行 解锁 。 


#include <pthread.h> 
int pthread_rwlock_rdlock(pthread_rwlock_t *rwlock) ; 
int pthread rwlock wrlock(pthread rwlock t *rwlock) ; 


int pthread rwlock unlock(pthread rwlock t *rwlock) ; 
所 有 的 返回 值 都 是 ; 车 成 功 则 返回 0， 否 则 返回 错误 编号 


在 实现 读 写 锁 的 时 候 可 能 会 对 共享 模式 下 可 获取 的 锁 的 数量 进行 限制 ， 所 以 需要 检查 
pthread_rwlock_rdlock 的 返回 值 。 即 使 bthread_rwlock_wrlock 和 pthread_ 
rwlock_unlock 有 错误 的 返回 值 ， 如 果 锁 设计 合理 的 话 ， 也 不 需要 检查 其 返回 值 。 错 误 返 回 
值 的 定义 只 是 针对 不 正确 地 使 用 读 写 锁 的 情况 ， 例 如 未 经 初始 化 的 锁 ， 或 者 试图 获取 已 拥有 的 
锁 从 而 可 能 产生 死 锁 这 样 的 错误 返回 等 。 

Single UNIX Specification 同 样 定义 了 有 条 件 的 读 写 锁 原 语 的 版 本 。 





#include <pthread.h> 
int pthread_rwlock_tryrdlock (pthread_rwlock_t *rwlock) ; 


int pthread rwlock trywrlock(pthread rwlock t *rwlock) ; 
两 者 的 返回 值 都 是 : 车 成 功 则 返回 0， 否 则 返回 错误 编号 





bbs.theithome.com 








11.6 线程 同步 307 


可 以 获取 锁 时 ， 函 数 返回 9， 否则 ,返回 错 误 EBUSY。 这 些 函 数 可 以 用 于 前 面 讨论 的 遵守 
菜 种 锁 层次 但 还 不 能 完全 避免 死 锁 的 情况 。 





程序 清单 11-8 中 的 程序 解释 了 读 写 锁 的 使 用 。 作 业 请 求 队列 由 单个 读 写 锁 保 护 。 这 个 例子 
给 出 了 图 11-1 的 可 能 的 一 种 实现 ， 以 此 实现 多 个 工作 线程 获取 由 单个 主线 程 分 配给 它们 的 作业 。 


程序 清单 11-8 使 用 读 写 锁 





#include <stdlib.h> 
#include <pthread.h> 


struct job { 
struct job *j next; 
struct job *j_prev; 
pthread_t j_id; /* tells which thread handles this job */ 
/* ... more stuff here ... */ 


E 


struct queue ( 
struct job *q head; 
struct job *q tail; 
pthread_rwlock_t q_lock; 


y; 
/* 


* Initialize a queue. 

*/ 
int 
queue init(struct queue *qp) 
{ 


int err; 


qp->q_head = NULL; 
qp-»q tail NULL; 
err - pthread rwlock init(&qp-»q lock, NULL); 
if (err != 0) 
return (err); 


"ou 


/* ... continue initialization ... */ 
return (0); 
} 
/* 
* Insert a job at the head of the queue. 
*/ 
void 


job_insert (struct queue *qp, struct job *jp) 
{ 
pthread rwlock wrlock(&qp-»q lock); 
jP-»j next = qp-»q head; 
jP-»J prev = NULL; 
if (qp-»q head != NULL) 
qp-»q head-»j prev = jp; 
else 
qp-»q tail - jp; /* list was empty */ 
qp-»q head - jp; 


bbs.theithome.com 








308 第 ll 章 线 gm 





pthread_rwlock_unlock (&qp->q_lock) ; 


} 


/* 
* Append a job on the tail of the queue. 
*/ 
void 
job append(struct queue *qp, struct job *jp) 


pthread rwlock wrlock(&qp-»q lock); 
jP-»j next = NULL; 
jP-»j prev = qp-»q tail; 
if (qp-»q tail != NULL) 
qp-»q tail-»j next = jp; 
else 
qp-»q head = jp; /* list was empty */ 
qp-»q tail - jp; 
pthread rwlock unlock(&qp-»q lock); 


) 
/* 


* Remove the given job from a queue. 
* 
/ 
void 
job remove(struct queue *qp, struct job *jp) 
{ 
pthread_rwlock_wrlock (&qp->q_lock) ; 
if (jp == qp-»q head) { 
qp-»q head = jp-»j next; 
if (qp-»q tail -- jp) 
qp-»q tail = NULL; 
} else if (jp == qp-»q tail) { 
qp-»q tail - jp-»j prev; 
if (qp-»q head == jp) 
qp-»q head - NULL; 
) else { 
jp->j_prev->j_next 
jp->j_next->j_prev 


jP-»j next; 
jP-»j prev; 


pthread rwlock unlock(&qp-»q lock); 


) 


/* 
* Find a job for the given thread ID. 
*/ 

struct job * 

job find(struct queue *qp, pthread t id) 


{ 


struct job *jp; 


if (pthread rwlock rdlock(&qp-»q lock) !- 0) 
return (NULL); 


for (jp = qp-»q head; jp != NULL; jp = jp-»j next) 
if (pthread equal(jp-»j id, id)) 
break; 


pthread rwlock unlock(&qp-»qd lock); 
return(jp); 


eG 
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在 这 个 例子 中 ， 不 管 什么 时 候 需 要 增加 一 个 作业 到 队列 中 或 者 从 队列 中 删除 作业 ， 都 用 写 
模式 锁 住 队列 的 读 写 锁 。 不 管 何 时 搜索 队列 ， 首 先 需要 获取 读 模式 下 的 锁 ， 人 允许 所 有 的 工作 线 
程 并 发 地 搜索 队列 。 在 这 种 情况 下 ， 只 有 线程 搜索 队列 的 频率 远 远 高 于 增加 或 删除 作业 时 ， 使 
用 读 写 锁 才 可 能 改善 性 能 。 

工作 线程 只 能 从 队列 中 读 取 与 它们 的 线程 ID 匹配 的 作业 。 既 然 作 业 结 构 同 一 时 间 只 能 由 一 
个 线程 使 用 ， 所 以 不 需要 额外 加 锁 。 D 


4. 条 件 变量 

条 件 变量 是 线程 可 用 的 另 一 种 同步 机 制 。 条 件 变量 给 多 个 线程 棍 供 了 一 个 会 合 的 场所 。 杂 
件 变 量 与 互 斥 量 一 起 使 用 时 ， 人 允许 线程 以 无 竞争 的 方式 等 待 特定 的 条 件 发 生 。 

条 件 本 身 是 由 互 斥 量 保护 的 。 线 程 在 改变 条 件 状 态 前 必须 首先 锁 住 互 斥 量 ， 其 他 线程 在 获 
得 互 斥 量 之 前 不 会 察觉 到 这 种 改变 ， 因 为 必须 锁定 互 斥 量 以 后 才能 计算 条 件 。 

条 件 变 量 使 用 之 前 必须 首先 进行 初始 化 ，pthread_cond_t 数 据 类 型 代表 的 条 件 变量 可 
以 用 两 种 方式 进行 初始 化 ， 可 以 把 常量 PTHREAD_COND_INITIALIZER 赋 给 静态 分 配 的 条 件 
变量 ,但 是 如 果 条 件 变 量 是 动态 分 配 的 ， 可 以 使 用 pthread_congd_init 函 数 进行 初始 化 。 

在 释放 底层 的 内 存 空间 之 前 ， 可 以 使 用 pthread_mutex_destroy 函 数 对 条 件 变量 进行 
去 除 初始 化 (deinitialize ) 。 


#include «pthread.h» 


int pthread cond init(pthread cond t *restrict cond, 
pthread condattr t *restrict attr) ; 


int pthread cond destroy (pthread cond t *cond) ; 


两 者 的 返回 值 都 是 : 若 成 功 则 返回 0， 否 则 返回 错误 编号 





除非 需要 创建 一 个 非 默 认 属 性 的 条 件 变 量 ， 否 则 pthread_cond_init 函 数 的 aftr 参 数 可 以 设 
置 为 NULL， 条 件 变 量 属性 将 在 12.4 节 中 讨论 。 

使 用 pthread_cond_wait 等 待 条 件 变 为 真 ， 如 果 在 给 定 的 时 间 内 条 件 不 能 满足 ， 那 么 会 
生成 一 个 代表 出 错 码 的 返回 变量 。 


#include <pthread.h> 


int pthread_cond_wait (pthread_cond_t *restrict cond, 
pthread_mutex_t *restrict mutex) ; 


int pthread_cond_timedwait (pthread_cond_t *restrict cond, 
pthread_mutex_t *restrict mutex, 
const struct timespec *restrict timeout) ; 


两 者 的 返回 值 都 是 ， 若 成 功 则 返回 9， 否 则 返回 错误 编号 





传递 给 pthread_cong_wait 的 互 斥 量 对 条 件 进行 保护 ， 调 用 者 把 锁 住 的 互 斥 量 传 给 函数 。 函 
数 把 调用 线程 放 到 等 待 条 件 的 线程 列表 上 ， 然 后 对 互 斥 量 解锁 ， 这 两 个 操作 是 原子 操作 。 这 样 
就 关闭 了 条 件 检 查 和 线程 进入 休眠 状态 等 待 条 件 改变 这 两 个 操作 之 间 的 时 间 通 道 ， 这 样 线程 就 
不 会 错过 条 件 的 任何 变化 。pthread_cond_wait 返 回 时 ， 互 斥 量 再 次 被 锁 住 。 
pthread_cond_timedwait 函 数 的 工作 方式 与 pthread_cond_wait 函 数 相 似 ， 只 是 
多 了 一 个 timeout。timeout 值 指定 了 等 待 的 时 间 ， 它 是 通过 timespec 结 构 指 定 。 时 间 值 用 秒 数 
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或 者 分 秒 数 来 表示 ， 分 秒 数 的 单位 是 纳 秒 。 


struct timespec { 
time_t tv_sec; /* seconds */ 

long tv nsec; /* nanoseconds */ 
使 用 这 个 结构 时 ， 需 要 指定 愿意 等 待 多 长 时 间 ， 时 间 值 是 一 个 绝对 数 而 不 是 相对 数 。 例 如 ， 如 
采 能 等 待 3 分 钟 ， 就 需要 把 当前 时 间 加 上 3 分 钟 再 转换 到 timespec 结 构 ， 而 不 是 把 3 分 钟 转换 
成 timespec 结 构 。 

可 以 使 用 gettimeofday ( 见 6.10 节 ) 获取 用 timeval1 结 构 表示 的 当前 时 间 ， 然 后 把 这 个 
时 间 转 换 成 timespec 结 构 。 要 得 到 timeout 值 的 绝对 时 间 ， 可 以 使 用 下 面 的 函数 : 

void 


maketimeout (struct timespec *tsp, long minutes) 


{ 


struct timeval now; 


/* get the current time */ 

gettimeofday (&now) ; 

tsp->tv_sec = now.tv_sec; 

tsp->tv_nsec = now.tv_usec * 1000; /* usec to nsec */ 
/* add the offset to get timeout value */ 
tsp->tv_sec += minutes * 60; 


} 


如 果 时 间 值 到 了 但 是 条 件 还 是 没有 出 现 ，pthread_cond_timedwait 将 重新 获取 互 斥 量 然后 
返回 错误 ETIMEDOUT。 从 pthread_congd_wai t 或 者 pthread_cond_timedwait 调 用 成 功 
返回 时 ， 线 程 需要 重新 计算 条 件 ， 因 为 其 他 的 线程 可 能 已 经 在 运行 并 改变 了 条 件 。 

有 两 个 函数 可 以 用 于 通知 线程 条 件 已 经 满足 。pthread_cond_signal 函数 将 唤醒 等 竺 
该 条 件 的 某 个 线程 ， 而 pthread_cond_broadcast 函 数 将 唤醒 等 待 该 条 件 的 所 有 线程 。 


POSIX 规 范 为 了 简化 实现 ， 允许 pthread_cond_sigmnal 在 实现 的 时 候 可 以 唤醒 不 止 一 个 线程 。 





#include <pthread.h> 


int pthread cond signal(pthread cond t *cond) ; 


int pthread cond broadcast (pthread cond t *cond); 


两 者 的 返回 值 都 是 : 若 成 功 则 返回 0， 否 则 返回 错误 编号 





调用 pthread_cond_s ignalM#pthread_cond_broadcast, 也 称 为 向 线程 或 条 件 
发 送信 号 。 必 须 注意 一 定 要 在 改变 条 件 状态 以 后 再 给 线程 发 送信 号 。 


程序 清单 11-9 给 出 了 如 何 结合 使 用 条 件 变量 和 互 斥 量 对 线程 进行 同步 。 
程序 清单 11-9 使 用 条 件 变 量 





#include <pthread.h> 


struct msg { 
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struct msg *m_next; 
/* ... more stuff here ... */ 
n 384 
struct msg *workq; 
pthread_cond_t qready = PTHREAD_COND_INITIALIZER; 
pthread mutex t qlock = PTHREAD MUTEX INITIALIZER; 


void 
process mag(void) 


struct msg *mp; 


for (;;) { 
pthread mutex lock(&qlock); 
while (workq == NULL) 

pthread cond wait(&qready, &qlock); 

mp - workq; 
workq = mp-»m next; 
pthread mutex unlock (&qlock) ; 
/* now process the message mp */ 

} 


} 


void 
enqueue msg (struct msg *mp) 


pthread_mutex_lock (&qlock) ; 
mp-»m next = workq; 

workq = mp; 
pthread_mutex_unlock (&qlock) ; 
pthread_cond_signal (&qready) ; 


} 


条 件 是 工作 队列 的 状态 。 用 互 斥 量 保护 条 件 ， 在 whi1le 循 环 中 判断 条 件 。 把 消息 放 到 工作 
队列 时 ， 需 要 占有 互 斥 量 ， 但 向 等 待 线程 发 送信 号 时 并 不 需要 占有 互 斥 量 。 只 要 线程 可 以 在 调 
用 cona_signal 之 前 把 消息 从 队列 中 拖 出 ， 就 可 以 在 释放 互 斥 量 以 后 再 完成 这 部 分 工作 。 因 
为 是 在 while 循 环 中 检查 条 件 ， 所 以 不 会 存在 问题 : 线程 醒 来 ， 发 现 队列 仍 为 空 ， 然 后 返回 继 


续 等 待 。 如 果 代 码 不 能 容忍 这 种 竞争 ， 就 需要 在 向 线程 发 送信 号 的 时 候 占 有 互 斥 量 。 [] 
11.7. 小 结 


在 本 章 中 ， 介 绍 了 线程 的 概念 ， 讨 论 了 现 有 的 创建 线程 和 销毁 线程 的 POSIX.1 原 语 ， 此 外 
还 介绍 了 线程 同步 问题 ， 讨 论 了 三 种 基本 的 同步 机 制 ， 互 斥 、 读 写 锁 以 及 条 件 变量 ， 了 解 了 如 
何 使 用 它们 来 保护 共享 资源 。 385 


习题 


1L1 修改 程序 清单 11-3 中 的 例子 ， 从 而 正确 地 在 线程 之 间 传 递 结 构 。 

11.2 在 程序 清单 11-8 的 例子 中 ， 需 要 另外 添加 什么 同步 〈 如 果 需 要 的 话 ) 才 可 以 使 得 主线 程 改 
变 与 未 决 作业 关联 的 线程 ID? 这 会 对 job_remove 函 数 产生 什么 影响 ? 

11.3. 把 程序 清单 11-9 中 的 技术 运用 到 工作 线程 实例 (图 11-1 和 程序 清单 11-8) 中 ， 以 实现 工作 
线程 函数 。 不 要 忘记 更 新 queue_init 函 数 对 条 件 变量 进行 初始 化 ， 修 改 job_insert 
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11.4 


和 job_append 函 数 通 知 工作 线程 。 会 出 现 什 么 样 的 困难 ? 

下 面 哪个 步骤 序列 是 正确 的 ? 

(D 对 互 斥 量 加 锁 (pthread_mutex_lock)。 

(2) 改变 互 斥 量 保护 的 条 件 。 

(3) 向 等 待 条 件 的 线程 发 送信 号 (pthread cond broadcast), 
(4) 对 互 斥 量 解锁 (othread_mutex_unlock), 

或 者 

(1) 对 互 斥 量 加 锁 (pthread, mutex lock), 

(2) 改变 互 斥 量 保护 的 条 件 。 

(3) 对 互 斥 量 解锁 (pthread_mutex_unlock)。 

(4) 向 等 待 条 件 的 线程 发 送信 号 (pthread_cond_broadcast), 
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第 12 章 
线程 控制 


12.1 引言 


在 第 11 章 中 ， 学 习 了 线程 和 线程 同步 的 基础 知识 。 在 本 章 中 ， 将 学 习 控制 线程 行为 方面 的 
详细 内 容 ， 在 前 面 的 章节 中 对 线程 属性 和 同步 原 语 属性 都 取 其 默认 行为 ， 忽 略 了 这 些 属性 的 具 
体 介绍 。 

接 下 来 将 介绍 同一 进程 中 的 多 个 线程 之 闻 如 何 保持 数据 的 私有 性 ， 最 后 讨论 基于 进程 的 系 
统 调用 如 何 与 线程 进行 交互 。 


12.2 线程 限制 


42.5.4 Hits T sysconf MAR, Single UNIX Specification 定 义 了 与 线程 操作 有 关 的 一 些 
限制 ， 表 2-10 并 没有 列 出 这 些 限制 。 与 其 他 的 系统 限制 一 样 ， 这 些 线程 限制 也 可 以 通过 
sysconf 畏 数 进行 查询 。 表 12-1 总 结 了 这 些 限 制 。 


表 12-1 线程 限制 和 sysconf 的 name 参 数 


PTHREAD_DESTRUCTOR_ 线程 退出 时 操作 系统 实现 试 _SC_THREAD_DESTRUCT 
ITERATIONS 图 销毁 线程 私有 数据 的 最 大 次 | OR ITERATIONS 
Be ( 见 12.6 节 ) 
PTHREAD_KEYS_MAX 进程 可 以 创建 的 键 的 最 大 数 _SC_THREAD_KEYS_MAX 


H (512.615) 

PTHREAD, STACK, MIN 一 个 线程 的 栈 可 用 的 最 小 字 _SC_THREAD_STACK_MIN 
节 数 (12:338) 

PTHREAD_THREADS_MAX 进程 可 以 创建 的 最 大 线程 数 _SC_THREAD_THREADS_ 
( 见 12.3 节 ) MAX 





与 sysconf 报 告 的 其 他 限制 一 样 ， 这 些 限制 的 使 用 是 为 了 增强 应 用 程序 在 不 同 的 操作 系统 
实现 之 间 的 可 移植 性 。 例 如 ， 如 果 应 用 程序 需要 为 它 管理 的 每 个 文件 创建 四 个 线程 ， 但 是 系统 
却 并 不 允许 创建 所 有 这 些 线程 ， 这 时 可 能 就 必须 限制 当前 可 并 发 管理 的 文件 数 。 

表 12-2 给 出 了 本 书 描述 的 四 种 操作 系统 实现 中 线程 限制 的 值 。 当 某 些 操作 系统 实现 没有 定 
义 相应 的 sysconf 符 号 (Asc FA) 时 ， 图 中 列 出 的 值 就 是 “未 定义 符号 ”， 如 果 操 作 系 
统 实现 的 限制 是 不 确定 的 ， 列 出 的 值 就 是 “没有 确定 的 限制 ， 但 这 并 不 意味 着 值 是 无 限制 
的 ，“ 不 支持 ”表明 操作 系统 实现 定义 了 相应 的 sysconf 限 制 符号 , 但 是 sysconf 消 数 无 法 
识别 这 个 符号 。 
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注意 ， 虽 然 某 些 操作 系统 实现 可 能 没有 提供 访问 这 些 限制 的 方法 ， 但 这 并 不 意味 着 这 些 限 制 不 存 
在 它 只 是 表明 操作 系统 实现 没有 提供 使 用 sysconf 访 问 这 些 值 的 方法 。 


表 12-2 线程 配置 限制 的 例子 


PTHREAD_DESTRUCTOR_ITERATIONS 设 有 确定 的 限制 


PTHREAD_KEYS_MAX 设 有 确定 的 限制 
PTHREAD_STACK_MIN 4096 
PTHREAD_THREADS_MAX 设 有 确定 的 限制 


12.3 线程 属性 


在 第 11 章 所 有 调用 pthread_create 函 数 的 例子 中 ， 传 人 的 参数 都 是 空 指针 ， 而 不 是 指向 
pthread_attr_t 结 构 的 指针 。 可 以 使 用 pthread_attr_t 结 构 修 改线 程 默认 属性 ， 并 把 这 
些 属性 与 创建 的 线程 联系 起 来 。 可 以 使 用 pthread_attr_init 函 数 初始 化 pthread_attr_t 
结构 。 调 用 pthread_attr_init 以 后 ，pthread_attr_t 结 构 所 包含 的 内 容 就 是 操作 系统 实 
现 支 持 的 线程 所 有 属性 的 默认 值 。 如 果 要 修改 其 中 个 别 属性 的 值 ， 需 要 调用 其 他 的 函数 ， 这 方 
面 的 细节 将 在 本 节 的 后 续 内 容 中 讨论 。 


#include <pthread.h> 





int pthread attr init(pthread attr t *attr); 


int pthread attr destroy(pthread attr t *attr); 
两 者 的 返回 值 都 是 : 若 成 功 则 返回 0， 和 否则 返回 错误 编号 





如 果 要 去 除 对 pthread_attr_t 结 构 的 初始 化 ， 可 以 调用 pthread_attr_dqestroy 国 
数 。 如 果 pthread_attr_init 实 现时 为 属性 对 象 分 配 了 动态 内 存 空间 ,，pthread_attr_ 
destroy 将 会 释放 该 内 存 空 间 。 除 此 之 外 ，pthread_attr_destroy 还 会 用 无 效 的 值 初始 
化 属性 对 象 ， 因 此 如 果 该 属性 对 象 被 误 用 ， 将 会 导致 pthread_create 函 数 返 回 错误 。 

pthread_attr_t 结 构 对 应 用 程序 是 不 透明 的 ， 也 就 是 说 应 用 程序 并 不 需要 了 解 有 关 属 
性 对 象 内 部 结构 的 任何 细节 ， 因 而 可 以 增强 应 用 程序 的 可 移植 性 。POSIX.1 沿 用 了 这 种 模型 ， 
并 且 为 查询 和 设置 每 种 属性 定义 了 独立 的 函数 。 

表 12-3 总 结 了 POSIX.1 定 义 的 线程 属性 。 虽 然 POSIX.1 还 为 实时 线程 定义 了 额外 的 属性 ， 但 
这 里 并 不 打算 讨论 这 些 属性 。 表 12-3 同 时 给 出 了 操作 系统 平台 对 每 种 线程 属性 的 支持 情况 。 如 
果 某 些 属性 是 通过 过 时 的 接口 进行 访问 的 ， 则 在 表 中 用 ob 表示 。 


表 12-3 POSIX.1 线程 属性 


detachstate | 线程 的 分 离 状 态 属性 


guardsize | 线程 栈 未 尾 的 警戒 缓 种 区 大 小 CEDE) 
stackaddr 线程 栈 的 最 低地 址 
stacksize | 线程 栈 的 大 小 〈 字 节 数 ) 
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11.5 节 介绍 了 分 离线 程 的 概念 。 如 果 对 现 有 的 某 个 线程 的 终止 状态 不 感 兴趣 的 话 ， 可 以 使 
用 pthreadq_aetach 函 数 让 操作 系统 在 线程 退出 时 收回 它 所 占用 的 资源 。 

如 果 在 创建 线程 时 就 知道 不 需要 了 解 线程 的 终止 状态 ， 则 可 以 修改 pthread_attr_t 结 构 
中 的 detachstate 线 程 属性 ， 让 线程 以 分 离 状 态 启 动 。 可 以 使 用 pthread_attr_ 
setdetachstate 函 数 把 线程 属性 detachstate 设 置 为 下 面 的 两 个 合法 值 之 一 ， 设置 为 PTHREAD_ 
CREATE_DETACHED， 以 分 离 状态 启动 线程 ， 或 者 设置 为 PTHREAD CREATE JOINABLE, E% 
启动 线程 ， 应 用 程序 可 以 获取 线程 的 终止 状态 。 38 


#include <pthread.h> 


int pthread_attr_getdetachstate(const pthread_attr_t *restrict attr, 
int *detachstate) ; 


int pthread attr setdetachstate(pthread attr t *attr, int detachstate) ; 
两 者 的 返回 值 都 是 ;车 成 功 则 返回 0， 否 则 返回 错误 编号 





可 以 调用 pthread_attr_getdetachstate 函 数 获取 当前 的 detachstate 线 程 属性 ， 第 二 
个 参数 所 指向 的 整数 也 许 被 设置 为 PTHREAD_CREATE_DETACHED， 也 可 能 设置 为 
PTHREAD_CREATE_JOINABLE， 具 体 要 取决 于 给 定 pthread_attr_t 结 构 中 的 属性 值 。 








程序 清单 12-1 给 出 了 一 个 以 分 离 状 态 创建 线程 的 函数 。 
程序 清单 12-1 以 分 离 状态 创建 的 线程 


#include "apue.h" 

#include <pthread.h> 

int 

makethread (void *(*fn) (void *), void *arg) 


int err; 
pthread_t tid; 
pthread_attr_t attr; 


err = pthread attr init(&attr); 
if (err != 0) 

return(err); 
err - pthread attr setdetachstate(&attr, PTHREAD CREATE DETACHED); 
if (err == 0) 

err - pthread create(&tid, &attr, fn, arg); 
pthread attr destroy(&attr); 
return(err); 


) 


注意 ， 这 里 忽略 了 pthread_attr_destroy 函 数 调用 的 返回 值 。 在 这 种 情况 下 ， 由 于 对 
线程 属性 进行 了 合理 的 初始 化 ，p thread_attr_destroy 一 般 不 会 失败 。 但 是 如 果 
pthread_attr_destroy 确 实 出 现 了 失败 的 情况 ， 清 理工 作 就 会 变 得 很 困难 : 必须 销毁 刚刚 
创建 的 线程 ， 而 这 个 线程 可 能 已 经 运行 ， 并且 与 pthread_attr_destroy 函 数 可 能 是 异步 执 
行 的 。 忽 上 略 pthread_attr_destroy 的 错误 返回 可 能 出 现 的 最 坏 情 况 是 如 果 pthread 
attr_init 分 配 了 内 存 空间 ， 这 些 内 存 空 间 会 被 泄漏 。 另 一 方面 ， 如 果 pthread_attzr_ 
init 成 功 地 对 线程 属性 进行 了 初始 化 ， 但 pthread_attr_destroy 在 做 清理 工作 时 却 出 现 
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了 失败 ， 就 没有 任何 补救 策略 ， 因 为 线程 属性 结构 对 应 用 来 说 是 不 透明 的 ， 可 以 对 线程 属性 结 
构 进行 清理 的 唯一 接口 是 pthread_attr_destroy, 但 它 失 败 了 。 D 


对 于 遵循 POSIX 标 准 的 操作 系统 来 说 ， 并 不 一 定 要 支持 线程 栈 属性 ， 但 是 对 遵循 XSI 的 系 
统 ， 支 持 线程 栈 属 性 就 是 必须 的 。 可 以 在 编译 阶段 使 用 _POSIX_THREAD_ATTR_STACKADDR 
和 _POSIX_THREAD_ATTR_STACKSIZE 符 号 来 检查 系统 是 否 支 持 线程 栈 属性 ， 如 果 系 统 定 义 
了 这 些 符 号 ， 就 说 明 它 支持 相应 的 线程 栈 属 性 。 也 可 以 通过 在 运行 阶段 把 _sC_THREAD_ 
ATTR_STRACKRADDR 和 _SC_THRERAD_ATTR_STRACKSIZE 参 数 传 给 sysconf 国 数 ， 检 查 系 统 对 
线程 栈 属 性 的 支持 情况 。 

POSIX.1 定 义 了 线程 栈 属 性 的 一 些 操作 接口 。 虽 然 很 多 pthread 实 现 中 仍然 提供 两 个 早 些 时 
候 的 函数 pthread_attr_getstackaddr 和 pthread attr_setstackaddr, 但 在 Single 
UNIX Specification 第 3 版 中 这 两 个 函数 已 被 标记 为 过 时 ， 线 程 栈 属性 的 查询 和 修改 一 般 是 通过 
较 新 的 函数 pthread_attr_getstack 和 pthread _attr_setstack 来 进行 。 这 些 新 的 函 
数 消 除了 老 接 口 定义 中 存在 的 二 义 性 。 

#include <pthread.h> 


int pthread_attr_getstack(const pthread attr t *restrict attr, 
void **restrict stackaddr, 
size_t *restrict stacksize) ; 


int pthread attr setstack(const pthread attr t *attr, 
void *stackaddr, size t *stacksize) ; 


两 者 的 返回 值 都 是 ， 若 成 功 则 返回 90， 否则 返回 错误 编号 





这 两 个 函数 可 以 用 于 管理 stackaddr 线 程 属性 ， 也 可 以 用 于 管理 stacksize 线 程 属性 。 

对 进程 来 说 ， 虚 拟 地 址 空间 的 大 小 是 固定 的 ， 进 程 中 只 有 一 个 栈 ， 所 以 它 的 大 小 通常 不 是 
问题 。 但 对 线程 来 说 ， 同 样 大 小 的 虚拟 地 址 空间 必须 被 所 有 的 线程 栈 共 享 。 如 果 应 用 程序 使 用 
了 大 多 的 线程 ， 致 使 线程 栈 的 累计 大 小 超过 了 可 用 的 虚拟 地 址 空间 ， 这 时 就 需要 减少 线程 默认 
的 栈 大 小 。 另 一 方面 ， 如 果 线 程 调用 的 函数 分 配 了 大 量 的 自动 变量 或 者 调用 的 函数 涉及 很 深 的 
Fel (stack frame)， 那 么 这 时 需要 的 栈 大 小 可 能 要 比 默认 的 大 。 

如 果 用 完了 线程 栈 的 虚拟 地 址 空间 ， 可 以 使 用 malloc 或 者 mmap (8.14.9435) 来 为 其 他 栈 
分 配 空间 ， 并 用 pthread_attr_setstack 尔 数 来 改变 新 建 线程 的 栈 位 置 。 线 程 栈 所 占 内 存 
范围 中 可 寻 址 的 最 低地 址 可 以 由 stackaddr 参 数 指定 ,该 地 址 与 处 理 器 结构 相应 的 边界 对 齐 。 

stackaddr 线 程 属性 被 定义 为 栈 的 内 存单 元 的 最 低地 址 ， 但 这 并 不 必然 是 栈 的 开始 位 置 。 对 
于 某 些 处 理 器 结构 来 说 ， 栈 是 从 高 地 址 向 低地 址 方向 伸展 的 ， 那 么 stackaddr 线 程 属性 就 是 栈 的 
结尾 而 不 是 开始 位 置 。 


pthread_attr_getstackaddr#epthread_attr_setstackaddr 4 & fá Æ F stackaddr FRAAA 
明确 地 指定 。 它 可 以 解释 为 找 的 开始 地 址 、 还 可 以 解释 成 用 作 栈 的 内 存 范 围 的 最 低地 址 。 在 栈 内 存 地 址 
空间 从 高 地 址 向 低地 址 扩展 的 处 理 器 结构 中 ， 如 果 stackercdlcdr 参 数 是 找 地 址 空间 的 最 低地 址 ， 那 么 就 需要 
知道 乒 的 大 小 才能 确定 找 的 开始 位 置 。Pthread_attr_getstack 和 Pthread_attr_setstack 函 数 纠正 
TERE, 


iy FARE th a] Dict thread_attr_getstacksizefflpthread_attr_setstacksize 
ER EH A E Ee I HE stacksize , 
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#include <pthread.h> 


int pthread attr getstacksize(const pthread attr t *restrict attr, 


size t *restrict stacksize) ; 
int pthread attr setstacksize(pthread attr t *attr, size t stacksize); 


两 者 的 返回 值 都 是 ， 若 成 功 则 返回 9， 和 否则 返回 错误 编号 





如 果 希 望 改变 栈 的 默认 大 小 ， 但 又 不 想 自己 处 理 线程 栈 的 分 配 问题 ， 这 时 使 用 pthread_ 
attr_setstacksize 国 数 就 非常 有 用 。 

线程 属性 guardsize 控 制 着 线程 栈 末 尾 之 后 用 以 避免 栈 溢 出 的 扩展 内 存 的 大 小 。 这 个 属性 默 
认 设 置 为 PAGESIZE 个 字 节 。 可 以 把 guardsize 线 程 属性 设 为 0， 从 而 不 允许 属性 的 这 种 特征 行为 
RE: 在 这 种 情况 下 不 会 提供 警戒 缓冲 区 。 同 样 地 ， 如 果 对 线程 属性 stackaddr 作 了 修改 ， 系 统 
就 会 假设 我 们 会 自己 管理 栈 ， 并 使 警戒 栈 缓 冲 区 机 制 无 效 ， 等 同 于 把 8xardsize 线 程 属 性 设 为 0。 


#include «pthread.h» 


int pthread_attr_getguardsize(const pthread_attr_t *restrict attr, 
size t *restrict guardsize) ; 


int pthread attr setguardsize(pthread attr t *attr, size t guardsize); 
两 者 的 返回 值 都 是 : 若 成 功 则 返回 0， 否 则 返回 错误 编号 





如 果 8guardsize 线 程 属性 被 修改 了 ， 操 作 系统 可 能 把 它 取 为 页 大 小 的 整数 倍 。 如 果 线 程 的 栈 
指针 溢出 到 警戒 区 域 ， 应 用 程序 就 可 能 通过 信号 接收 到 出 错 信息 。 

Single UNIX Specification 还 定义 了 其 他 的 一 些 可 选 的 线程 属性 作为 实时 线程 可 选 属性 的 一 
部 分 ， 但 在 这 里 不 讨论 这 些 属 性 。 

更 多 的 线程 属性 

线程 还 有 其 他 的 一 些 属 性 ， 这 些 属性 并 没有 在 Pthread_attz_t 结 构 中 表达 : 

“可 取消 状态 (在 12.7 节 中 讨论 )。 

“可 取消 类 型 (同样 在 12.7 节 中 讨论 )。 

HRE. 

并 发 度 控 制 着 用 户 级 线程 可 以 映射 的 内 核 线 程 或 进程 的 数目 。 如 果 操 作 系统 的 实现 在 内 核 
级 的 线程 和 用 户 级 的 线程 之 间 保 持 一 对 一 的 映射 ， 那 么 改变 并 发 度 并 不 会 有 什么 效果 ， 因 为 所 
有 的 用 户 级 的 线程 都 可 能 被 调度 到 。 但 是 ， 如 果 操 作 系统 的 实现 让 用 户 级 线程 到 内 核 级 线程 或 
进程 之 间 的 映射 关系 是 多 对 一 的 话 ， 那 么 在 给 定时 间 内 增加 可 运行 的 用 户 级 线程 数 ， 可 能 会 改 
善 性 能 。pthread_setconcurrency 函 数 可 以 用 于 提示 系统 ， 表 明 希 望 的 并 发 度 。 

#include <pthread.h> 

int pthread_getconcurrency (void) ; 


BEE: 当前 的 并 发 度 


int pthread_setconcurrency (int level); 


返回 值 ， 若 成 功 则 返回 9， 否 则 返回 错误 编号 


pthread_getconcurrency 国 数 返 回 当前 的 并 发 度 。 如 果 操 作 系统 当前 正 控制 着 并 发 度 
( 即 之 前 没有 调用 过 pthreaa_setconcurrency 国 数 )， 那 么 pthreaa_getconcurrency 
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将 返回 0。 

pthread_setconcurrency 函 数 设 定 的 并 发 度 只 是 对 系统 的 一 个 提示 ， 系 统 并 不 保证 请 
求 的 并 发 度 一 定 会 被 采用 。 如 果 希 望 系统 自己 决定 使 用 什么 样 的 并 发 度 ， 就 把 传人 的 参数 level 
设 为 0。 这 样 ， 应 用 程序 调用 level 参 数 为 0 的 pthread_setconcurrency 函 数 ， 就 可 以 撤销 在 
这 之 前 leve! 参 数 非 零 的 pthread_setconcurrency 调 用 所 产生 的 作用 。 


12.4 同步 属性 

就 像 线程 具 有 属性 一 样 ， 线 程 的 同步 对 象 也 有 属性 。 本 节 讨 论 互 斥 量 、 读 写 锁 和 条 件 变量 
的 属性 。 

1. 互 斥 量 属性 

用 pthread_mutexattr_init 初 始 化 pthread_mutexattr_t 结 构 ， 用 pthread_ 
mutexattr._destroy 来 对 该 结构 进行 回收 。 i 

#include <pthread.h> 


int pthread mutexattr init(pthread mutexattr t *attr) ; 


int pthread mutexattr destroy(pthread mutexattr t *attr) ; 


返回 值 ， 若 成 功 则 返回 9?， 否 则 返回 错误 编号 





pthread_mutexattr_init 函 数 用 默认 的 互 斥 量 属性 初始 化 pthread_mutexattr_t 
结构 。 值 得 注意 的 两 个 属性 是 进程 共享 属性 和 类 型 属性 。POSIX.1 中 ， 进 程 共享 属性 是 可 选 的 ， 
可 以 通过 检查 系统 中 是 否定 义 了 _POSIX_THREAD_PROCESS_SHARED 符 号 来 判断 这 个 平台 是 
否 支持 进程 共享 这 个 属性 ， 也 可 以 在 运行 时 把 _SC_THRERAD_PROCESS_SHARED 参 数 传 给 
sysconf 销 数 进行 检查 。 虽 然 这 个 选项 并 不 是 遵循 POSIX 标 准 的 操作 系统 必须 提供 的 ， 但 是 
Single UNIX Specification 要 求 遵 循 XSI 标 准 的 操作 系统 支持 这 个 选项 。 

在 进程 中 ， 多 个 线程 可 以 访问 同一 个 同步 对 象 。 在 第 11 章 中 已 说 明 ， 这 是 默认 的 行为 。 在 
这 种 情况 下 ， 进 程 共 享 互 斥 量 属性 需 设置 为 PTHREAD_PROCESS_PRIVATE。 

第 14 章 和 第 15 章 将 说 明 ， 存 在 这 样 的 机 制 ， 允 许 相互 独立 的 多 个 进程 把 同一 个 内 存 区 域 映 
射 到 它们 各 自 独立 的 地 址 空间 中 。 就 像 多 个 线程 访问 共享 数据 一 样 ， 多 个 进程 访问 共享 数据 通 
常 也 需要 同步 。 如 果 进 程 共享 互 斥 量 属性 设置 为 PTHREAD_PROCESS_SHARED， 从 多 个 进程 共 
享 的 内 存 区 域 中 分 配 的 互 斥 量 就 可 以 用 于 这 些 进程 的 同步 。 

可 以 使 用 pthread_mutexattr_getpshared 国 数 查询 pthread_mutexattr 上 结构 ， 
得 到 它 的 进程 共享 属性 ， 可 以 用 pthread_mutexattr_setpshared 函 数 修改 进程 共享 属性 。 

#include <pthread.h> 

int pthread mutexattr getpshared(const pthread mutexattr t * 


restrict attr, 
int *restrict pshared) ; 


int pthread mutexattr setpshared(pthread mutexattr t ‘attr, 
int pshared) ; 


返回 值 ， 车 成 功 则 返回 9?， 否 则 返回 错误 编号 
进程 共享 互 斥 量 属性 设 为 PTHRERAD_PROCESS_PRIVRATE 时 ， 人 允许 pthread 线 程 库 提 供 更 加 有 





bbs.theithome.com 








124 同步 属性 319 


效 的 互 斥 量 实 现 ， 这 在 多 线程 应 用 程序 中 是 默认 的 情况 。 在 多 个 进程 共享 多 个 互 斥 量 的 情况 下 ， 
pthread 线 程 库 可 以 限制 开销 较 大 的 互 斥 量 实现 。 

类 型 互 斥 量 属性 控制 着 互 斥 量 的 特性 。POSIX.1 定 义 了 四 种 类 型 。PTHRERAD_MUTEX_ 
NORMRL 类 型 是 标准 的 互 斥 量 类 型 ， 并 不 做 任何 特殊 的 错误 检查 或 死 锁 检 测 。PTHRERAD_ 
MUTEX_ERRORCHECK 互 斥 量 类 型 提供 错误 检查 。 

PTHREAD_MUTEX_RECURSIVE 互 斥 量 类 型 允许 同一 线程 在 互 斥 量 解锁 之 前 对 该 互 斥 量 进 
行 多 次 加 锁 。 用 一 个 递归 互 斥 量 维护 锁 的 计数 ， 在 解锁 的 次 数 和 加 锁 次 数 不 相同 的 情况 下 不 会 
释放 锁 。 所 以 如 果 对 一 个 递归 互 斥 量 加 锁 两 次 ， 然 后 对 它 解 锁 一 次 ， 这 个 互 斥 量 依然 处 于 加 锁 
状态 ， 在 对 它 再 次 解锁 以 前 不 能 释放 该 锁 。 

最 后 ，PTHREAD_MUTEX_DEFAULT 类 型 可 以 用 于 请 求 默 认 语义 。 操 作 系统 在 实现 它 的 时 候 
可 以 把 这 种 类 型 自由 地 映射 到 其 他 类 型 。 例 如 ， 在 Linux 中 ， 这 种 类 型 映射 为 普通 的 互 斥 量 类 型 。 

四 种 类 型 的 行为 如 表 12-4 所 示 。“ 不 占用 时 解锁 ”这 一 栏 指 的 是 一 个 线程 对 被 另 一 个 线程 加 
锁 的 互 斥 量 进行 解锁 的 情况 ，“ 在 已 解锁 时 解锁 ”这 一 栏 指 的 是 当 一 个 线程 对 已 经 解锁 的 互 斥 
量 进行 解锁 时 将 会 发 生 的 情况 ， 这 通常 是 编码 错误 所 致 。 


表 12-4 互 斥 量 类 型 行为 


没有 解锁 时 再 次 加 锁 ? | 不 占用 时 解锁 ”| ”在 已 解锁 时 解锁 ? 


PTHREAD_MUTEX_NORMAL 未 定义 


PTHREAD_MUTEX_ERRORCHECK 返回 错误 
PTHREAD_MUTEX_RECURSIVE i 返回 错误 
PTHREAD_MUTEX_DEFAULT 未 定义 





可 以 用 pthreadq_mutexattr_gettype 国 数 得 到 互 斥 量 类 型 属性 ， 用 pthread_ 
mutexattr_settype 函 数 修改 互 斥 量 类 型 属性 。 


#include <pthread.h> 


int pthread_mutexattr_gettype(const pthread_mutexattr_t * 
restrict attr, int *restrict type); 


int pthread mutexattr settype(pthread mutexattr t *attr, int type); 
两 者 的 返回 值 都 是 : 若 成 功 则 返回 0， 和 否则 返回 错误 编号 





回忆 11.6 节 中 学 过 的 ， 互 斥 量 用 于 保护 与 条 件 变量 关联 的 条 件 。 在 阻塞 线程 之 前 ， 
bthread_cond_waict 和 pthread_cond_timedwait 国 数 释 放 与 条 件 相 关 的 互 斥 量 ， 这 就 允 
许 其 他 线程 获取 互 扩 量 、 改 变 条 件 、 释 放 互 斥 量 并 向 条 件 变 量 发 送信 号 。 既 然 改 变 条 件 时 必须 
占有 互 斥 量 ， 所 以 使 用 递归 互 斥 量 并 不 是 好 的 办 法 。 如 果 递 归 互 斥 量 被 多 次 加 锁 ， 然 后 用 在 调 
用 pthreaaq_conaq_wait 国 数 中 ， 那 么 条 件 永远 都 不 会 得 到 注 足 ， 因 为 pthzread_condq_wait 
所 做 的 解锁 操作 并 不 能 释放 互 斥 量 。 

如 果 需 要 把 现 有 的 单线 程 接口 放 到 多 线程 环境 中 ， 递 归 互 斥 量 是 非常 有 用 的 ， 但 由 于 程序 
兼容 性 的 限制 ， 不 能 对 函数 接口 进行 修改 。 然 而 由 于 递归 锁 的 使 用 需要 一 定 技巧 ， 它 只 应 在 没 
有 其 他 可 行 方案 的 情况 下 使 用 。 









图 12-1 解 释 了 递归 锁 看 似 解决 并 发 问题 的 情况 。 假 设 iuncl 和 func2 是 函数 库 中 现 有 的 函 
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数 ， 其 接口 不 能 改变 ， 因 为 存在 调用 这 两 个 接口 的 应 用 程序 ， 而 且 应 用 程序 不 能 改动 。 


uU 
e 


funcl (x) — funci 


pthread mutex lock (x->lock) 





func2 (x) 


pthread_mutex_unlock (x->lock) 


func2 (x) - func2 


pthread_mutex_lock (x->lock) 





pthread mutex unlock (x->lock) 


图 12-1 使 用 递归 锁 的 情况 


为 了 保持 接口 跟 原 来 相同 ， 可 以 把 互 斥 量 幅 人 到 数据 结构 中 ， 把 这 个 数据 结构 的 地 址 (x) 
作为 参数 传人 。 这 种 方案 只 有 在 为 该 数据 结构 提供 了 分 配 函 数 时 才 可 行 ， 所 以 应 用 并 不 知道 数 
据 结构 的 大 小 〈 假 设 在 其 中 增加 互 斥 量 后 必须 扩大 该 数据 结构 的 大 小 ) 。 


如 果 在 最 初 定义 数据 结构 时 ， 预 留 了 足够 的 可 填充 字段 ， 允 许 把 一 些 填充 字段 替换 成 互 斥 量 ， 那 
么 这 种 方法 也 是 可 行 的 。 不 过 ， 大 多 数 程序 员 并 不 善于 预测 未 来 ， 所 以 这 不 是 普遍 可 行 的 经 验 。 


如 果 funci 和 func2 函 数 都 必须 操作 这 个 结构 ， 而 且 可 能 会 有 多 个 线程 同时 访问 该 数据 结 
构 ， 那 么 func1 和 func2 必 须 在 操作 数据 以 前 对 互 斥 量 加 锁 。 当 func1 必 须 调 用 func2 时 ， 如 
采 互 斥 量 不 是 递归 类 型 ， 那 么 就 会 出 现 死 锁 。 如 果 能 在 调用 func2 之 前 释放 互 斥 量 ， 在 func2 
返回 后 重新 获取 互 斥 量 ， 那 么 就 可 以 避免 使 用 递归 互 斥 量 ， 但 这 也 给 其 他 的 线程 提供 了 机 会 ， 
其 他 的 线程 可 能 在 func1 执 行 期 间 得 到 互 斥 量 的 控制 权 ， 修 改 这 个 数据 结构 。 这 也 许 是 不 可 接 
受 的， 当然 具体 的 情况 要 取决 于 互 斥 量 试图 提供 什么 样 的 保护 。 

图 12-2 显 示 了 这 种 情况 下 使 用 递归 互 斥 量 的 另 一 种 赫 代 方法 。 通 过 提供 func2 函 数 的 私有 
版 本 ( 称 之 为 fqnc2_locked 函 数 )， 可 以 保持 funcil 和 func2 函 数 接口 不 变 ， 并 且 避 人 免 使 用 
递归 互 斥 量 。 要 调用 func2_1ocked 国 数 ， 必 须 占 有 和 仍 人 到 数据 结构 中 的 互 斥 量 ， 这 个 数据 结 
构 的 地 址 是 作为 参数 传人 的 。func2_1locked 的 函数 体 包 含 func2 的 副本 ，func2 现 在 只 是 用 
以 获取 互 斥 量 ,调用 func2_1locked， 最 后 释放 互 斥 量 。 

如 果 并 不 一 定 要 保持 库 函 数 接口 不 变 ， 就 可 以 在 每 个 函数 中 另外 再 加 一 个 参数 ， 以 表明 这 
全 结构 是 否 被 调用 者 锁定 。 但 是 ， 如 果 可 能 的 话 ， 保 持 接口 不 变通 常 是 更 好 的 选择 ， 这 样 可 以 
避免 实现 过 程 中 人 为 加 入 的 东西 对 原 有 接口 产生 不 良 影 响 。 

提供 函数 的 加 锁 版 本 和 不 加 锁 版 本 ， 这 样 的 策略 在 简单 的 情况 下 通常 是 可 行 的 。 在 比较 复 
杂 的 情况 下 ， 例 如 库 需 要 调用 库 以 外 的 函数 ， 而 且 可 能 会 再 次 回调 库 中 的 函数 时 ， 就 需要 依赖 
递归 锁 。 LJ 
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ne (x) 


pthread_mutex_lock (x->lock) 





func2_locked (x) 


pthread_mutex_unlock (x->lock) 


pthread mutex_lock (x->lock) 
func2 locked (x) func2_locked 


pthread_mutex_unlock (x->lock) 


图 12-2 避免 使 用 递归 锁 的 情况 











程序 清单 12-2 解 释 了 有 必要 使 用 递归 互 斥 量 的 另 一 种 情况 。 这 里 ， 有 一 个 “超时 ” 
(timeout) 函数 ， 它 允许 另 一 个 函数 可 以 安排 在 未 来 的 某 个 时 间 运 行 。 假 设 线程 并 不 是 很 昂贵 
的 资源 ， 可 以 为 每 个 未 决 的 超时 函数 创建 一 个 线程 。 线 程 在 时 间 未 到 时 将 一 直 等 待 ， 时 间 到 了 
以 后 就 调用 请 求 的 函数 。 

程序 清单 12-2 使 用 递归 互 斥 量 





#include "apue.h" 
#include «pthread.h» 
#include <time.h> 
#include <sys/time.h> 


extern int makethread(void *(*) (void *), void *); 


struct to_info { 


void (*to fn) (void *); /* function */ 
void *to arg; /* argument */ 
struct timespec to wait; /* time to wait */ 


}; 


#define SECTONSEC 1000000000 /* Seconds to nanoseconds */ 
#define USECTONSEC 1000 /* microseconds to nanoseconds */ 


void * 
timeout_helper (void *arg) 


{ 


struct to info *tip; 


tip = (struct to_info *)arg; 
nanosleep (&tip->to_wait, NULL); 
(*tip->to_fn) (tip-»to arg); 
return(0); 
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void 
timeout (const struct timespec *when, void (*func) (void *), void *arg) 
{ 
struct timespec now; 
struct timeval tv; 
struct to info *tip; 
int err; 
gettimeofday(&tv, NULL); 
now.tv sec - tv.tv sec; 
now.tv_nsec = tv.tv usec * USECTONSEC; 
if ((when-»tv sec > now.tv sec) || 
(when-»tv sec -- now.tv sec && when-»tv nsec » now.tv nsec)) ( 
tip = malloc(sizeof(struct to info)); 
if (tip != NULL) { 
tip-»to fn = func; 
tip-»to arg = arg; 
tip-»to wait.tv sec - when-»tv sec - now.tv sec; 
if (when-»tv nsec »- now.tv nsec) [ 
tip-»to wait.tv nsec - when-»tv nsec - now.tv nsec; 
) eise ( 
tip-»to wait.tv sec--; 
tip-»to wait.tv nsec = SECTONSEC - now.tv nsec + 
when-»tv nsec; 
) 
err - makethread(timeout helper, (void *)tip); 
if (err == 0) 
return; 
) 
) 
/* 
* We get here if (a) when «- now, or (b) malloc fails, or 
* (c) we can't make a thread, so we just call the function now. 
*/ 
(*func) (arg); 
) 


pthread mutexattr t attr; 
pthread mutex t mutex; 


void 
retry(void *arg) 


( 


) 


int 


pthread mutex lock (&mutex) ; 
/* perform retry steps ... */ 
pthread mutex unlock(&mutex); 


main (void) 


{ 


int err, condition, arg; 
struct timespec when; 


if ((err = pthread mutexattr init(&attr)) != 0) 
err_exit(err, "pthread mutexattr init failed"); 
if ((err = pthread mutexattr settype(&attr, 


PTHREAD MUTEX RECURSIVE)) != 0) 
err exit(err, "can't set recursive type"); 
if ((err = pthread mutex init(&mutex, &attr)) !- 0) 
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err exit (err, "can't create recursive mutex"); 


[een 
pthread mutex lock(&mutex); 
PE eat Vin 


if (condition) ( 
/* calculate target time "when" */ 
timeout(&when, retry, (void *)arg); 


) 

PASS E aad | 

pthread mutex unlock (&mutex) ; 
Jr OR 

exit(0); 


) 


如 果 不 能 创建 线程 ， 或 者 安排 函数 运行 的 时 间 已 过 ， 问 题 就 出 现 了 。 在 这 种 情况 下 ， 要 从 
当前 环境 中 调用 之 前 请 求 运 行 的 函数 ， 因 为 函数 要 获取 的 锁 和 现在 占有 的 锁 是 同一 个 ， 除 非 该 
销 是 递归 的 ， 否 则 就 会 出 现 死 锁 。 

这 里 使 用 程序 清单 12-1 中 的 makethread 函 数 以 分 离 状态 创建 线程 。 希 望 函 数 在 未 来 的 某 
个 时 间 运 行 ， 而 且 不 希望 一 直 等 待 线程 结束 。 

可 以 调用 sleep 等 待 超 时 到 达 ， 但 它 提供 的 时 间 粒 度 是 秒 级 的 ， 如 果 希 望 等 待 的 时 间 不 是 
整数 秒 ， 需 要 用 nanosleep(2) 函 数 ， 它 提供 了 类 似 的 功能 。 


虽然 nanosleep 只 有 在 Single UNIX Specification 实 时 扩展 中 是 必须 实现 的 ， 但 本 文 讨论 的 所 有 平 
台 都 支持 该 沼 数 。 


timeout 的 调用 者 需要 占有 互 斥 量 来 检查 条 件 ， 并 且 把 retry 函 数 安排 为 原子 操作 。 
retry 函 数 试图 对 同一 个 互 斥 量 进行 加 锁 ， 因 此 ， 除 非 互 斥 量 是 递归 的 ， 否 则 如 果 timeout 函 
数 直 接 调用 retry 就 会 导致 死 锁 。 m 

2. 读 写 锁 属性 

读 写 锁 与 互 斥 量 类 似 ， 也 具有 属性 。 用 pthread_rwlockattr_init 初 始 化 pthread_ 
rwlockattr_t 结 构 ， 用 pthread_rwlockattr_destroy 回 收 结构 。 


397 
a 
399 


#include «pthread.h» 


int pthread_rwlockattr_init (pthread rwlockattr t *attr) ; 


int pthread rwlockattr destroy(pthread rwlockattr t *attr); 
两 者 的 返回 值 都 是 : 若 成 功 则 返回 0， 否 则 返回 错误 编号 


读 写 锁 支 持 的 唯一 属性 是 进程 共享 属性 ， 该 属性 与 互 斥 量 的 进程 共享 属性 相同 。 就 像 互 斥 
景 的 进程 共享 属性 一 样 ， 用 一 对 函数 来 读 取 和 设置 读 写 锁 的 进程 共享 属性 。 


#include <pthread.h> 





int pthread rwlockattr getpshared (const pthread rwlockattr t * 
restrict attr, 
int *restrict pshared) ; 


int pthread rwlockattr setpshared(pthread rwlockattr t ‘attr, 
int pshared) ; 


两 者 的 返回 值 都 是 ， 若 成 功 则 返回 9， 否 则 返回 错误 编号 





bbs.theithome.com 








324 第 12 章 线程 控制 

虽然 POSIX 只 定义 了 一 个 读 写 锁 属性 ， 但 不 同 平台 的 实现 可 以 自由 地 定义 额外 的 、 非 标准 
的 属性 。 

3. 条 件 变量 属性 

条 件 变 量 也 有 属性 。 与 互 斥 量 和 读 写 锁 类 似 ， 有 一 对 函数 用 于 初始 化 和 回收 条 件 变 量 属性 。 


#include <pthread.h> 


int pthread condattr init (pthread_condattr_t *atir); 


int pthread condattr destroy(pthread condattr t *attr); 


两 者 的 返回 值 都 是 ， 若 成 功 则 返回 9， 否 则 返回 错误 编号 


与 其 他 的 同步 原 语 一 样 ， 条 件 变量 支持 进程 共享 属性 。 





#include <pthread.h> 


int pthread_condattr_getpshared(const pthread_condattr_t * 
restrict attr, 
int *restrict pshared) ; 





int pthread condattr setpshared(pthread condattr t ‘attr, 


12.5 BA 


int pshared) ; 


两 者 的 返回 值 都 是 : 车 成 功 则 返回 0， 否 则 返回 错误 编号 





在 10.6 节 中 讨论 了 可 重信 函数 和 信号 处 理 程 序 。 在 遇 到 重 和 人 问题 时 线程 与 信号 处 理 程序 类 
似 。 有 了 信号 处 理 程 序 和 线程 ， 多 个 控制 线程 在 同一 时 间 可 能 潜在 地 调用 同一 个 函数 。 

如 果 一 个 函数 在 同一 时 刻 可 以 被 多 个 线程 安全 地 调用 ， 就 称 该 函数 是 线程 安全 的 。 在 
Single UNIX Specification 中 定义 的 所 有 函数 ， 除 了 表 12-5 中 列 出 的 函数 以 外 ， 其 他 函数 都 保证 
是 线程 安全 的 。 另 外 ，ctermid 和 tmpnam 函 数 在 参数 传人 空 指针 时 并 不 能 保证 是 线程 安全 的 。 
类 似 地 ，wcrtomb 和 wcsrtombs 函 数 如 果 参 数 mbstate_t 传 人 的 是 空 指针 的 话 ， 也 不 能 保证 


它们 是 线程 安全 的 。 


asctime 
basename 
catgets 
crypt 

ctime 

dbm clearerr 
dbm close 
dbm delete 
dbm error 
dbm fetch 
dbm firstkey 
dbm nextkey 
dbm open 

dbm store 
dirname 
dlerror 
drand48 


12-5 POSIX.1 中 不 能 保证 线程 安全 的 函数 


ecvt 

encrypt 
endgrent 
endpwent 
endutxent 
fcvt 

ftw 

gcvt 

getc unlocked 
getchar unlocked 
getdate 
getenv 
getgrent 
getgrgid 
getgrnam 
gethostbyaddr 
gethostbyname 


gethostent 
getlogin 
getnetbyaddr 
getnetbyname 
getnetent 
getopt 
getprotobyname 
getprotobynumber 
getprotoent 
getpwent 
getpwnam 
getpwuid 
getservbyname 
getservbyport 
getservent 
getutxent 
getutxid 


getutxline 
gmtime 
hcreate 
hdestroy 
hsearch 
inet_ntoa 
164a 
lgamma 
lgammaf 
lgammal 
localeconv 
localtime 
lrand48 
mrand48 
nftw 

nl langinfo 
ptsname 
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putc unlocked 
putchar unlocked 
putenv 
pututxline 
rand 

readdir 
setenv 
setgrent 
setkey 
setpwent 
setutxent 
strerror 
strtok 
ttyname 
unsetenv 
wCstombs 
wctomb 
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支持 线程 安全 函数 的 操作 系统 实现 会 在 <unista.h> 中 定义 符号 _POSIX_THREAD_ 
SAFE_FUNCTIONS。 应 用 程序 可 以 在 sysconf 函 数 中 传人 _SC_THREAD_SAFE_FUNCTIONS 
参数 ， 以 在 运行 时 检查 是 否 支持 线程 安全 函数 。 所 有 遵循 XSI 的 实现 要 求 必须 支持 线程 安全 函数 。 

操作 系统 实现 支持 线程 安全 函数 这 一 特性 时 ， 对 POSIX.1 中 的 一 些 非 线 程 安全 函数 ， 它 会 
提供 可 替代 的 线程 安全 版 本 ， 表 12-6 列 出 了 这 些 函 数 的 线程 安全 版 本 。 很 多 函数 并 不 是 线程 安 
全 的 ， 因 为 他 们 返回 的 数据 是 存放 在 静态 的 内 存 缓冲 区 中 。 通 过 修改 接口 ， 要 求 调 用 者 自己 提 
供 缓冲 区 可 以 使 函数 变 为 线程 安全 的 。 


表 12-6 替代 的 线程 安全 函数 


acstime_r gmtime_r 
ctime_r localtime_r 
getgrgid r rand r 
getgrnam r readdir r 


getlogin r strerror r 
getpwnam r strtok_r 
getpwuid r ttyname r 


表 12-6 中 列 出 的 函数 的 命名 方式 与 他 们 的 非 线程 安全 版 本 的 名 字 相 似 ， 只 不 过 在 名 字 最 后 
加 了 _r， 以 表明 这 个 版 本 是 可 重 入 的 。 

如 果 一 个 函数 对 多 个 线程 来 说 是 可 重 入 的 ， 则 说 这 个 函数 是 线程 安全 的 ， 但 这 并 不 能 说 明 
对 信号 处 理 程序 来 说 该 函数 也 是 可 重 和 人 的 。 如 果 溯 数 对 异步 信号 处 理 程 序 的 重信 是 安全 的 ， 那 
么 就 可 以 说 函数 是 异步 一 信号 安全 的 。 在 10.6 节 中 讨论 可 重信 函数 时 ， 表 10-3 中 的 函数 就 是 异步 
信和 号 安全 函数 。 

除了 表 12-6 中 列 出 的 函数 ，POSIX.1 还 提供 了 以 线程 安全 的 方式 管理 FILE 对 象 的 方法 。 可 
以 使 用 flockfile 和 ftrylockfile 获 取 与 给 定 FILE 对 象 关联 的 锁 。 这 个 锁 是 递归 的 ， 当 占 
有 这 把 锁 的 时 候 ， 还 可 以 再 次 获取 该 锁 ， 这 并 不 会 导致 死 锁 。 虽 然 这 种 锁 的 具体 实现 并 无 规定 ， 
但 要 求 所 有 操作 FILE 对 象 的 标准 1/0 例 程 表 现 得 就 像 它们 内 部 调用 了 f1ockfile 和 
funlockfile—}¥, 





#include <stdio.h> 
int ftrylockfile (FILE *fp) ; 


返回 值 ， 若 成 功 则 返回 9， 否 则 返回 非 0 值 


void flockfile(FILE *fp); 





void funlockfile(FILE *fp); 


虽然 标准 的 VO 例 程 从 它们 各 自 的 内 部 数据 结构 这 一 角度 出 发 ， 可 能 是 以 线程 安全 的 方式 实 
现 的 ， 但 有 时 把 锁 开 放 给 应 用 程序 仍然 是 非常 有 用 的 。 这 允许 应 用 程序 把 多 个 对 标准 MO 函数 的 
调用 组 合成 原子 序列 。 当 然 ， 在 处 理 多 个 FILE 对 象 时 ， 需 要 注意 可 能 出 现 的 死 锁 ， 并 且 需 要 
对 所 有 的 锁 仔 细 地 排序 。 

如 果 标 准 VO 例 程 都 获取 它们 各 自 的 锁 ， 那 么 在 做 一 次 一 个 字符 的 IO 操作 时 性 能 就 会 出 现 
严重 的 下 降 。 在 这 种 情况 下 ， 需 要 对 每 一 个 字符 的 读 或 写 操作 进行 获取 锁 和 释放 锁 的 动作 。 为 
了 避免 这 种 开销 ， 出 现 了 不 加 锁 版 本 的 基于 字符 的 标准 MO 例 程 。 
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#include <stdio.h> 
int getchar unlocked (void); 
int getc unlocked(FILE *fp); 
两 者 的 返回 值 都 是 ， 若 成 功 则 返回 下 一 个 字符 ， 若 已 到 达 文 件 结尾 或 出 错 则 返回 EOF 


int putchar unlocked (int c); 


int putc_unlocked(int c, FILE *fp); 
两 者 的 返回 值 都 是 : 若 成 功 则 返回 c， 若 出 错 则 返回 EOF 





除非 被 flockfile (Mftrylockfile) 和 funlockfile 的 调用 包围 ， 否 则 尽量 不 要 
调用 这 四 个 函数 ， 因 为 它们 会 导致 不 可 预期 的 结果 ( 即 由 多 个 控制 线程 非 同步 地 访问 数据 所 引 
起 的 种 种 问题 )。 

一 旦 对 FILE 对 象 进 行 加 锁 ， 就 可 以 在 释放 锁 之 前 对 这 些 函 数 进行 多 次 调用 。 这 样 就 可 以 
在 多 次 的 数据 读 写 上 分 摊 总 的 加 解锁 的 开销 。 





程序 清单 12-3 显 示 了 getenv ( 见 7.9 节 ) 一 个 可 能 的 实现 。 因 为 所 有 调用 getenv 的 线程 
返回 的 字符 串 都 存放 在 同一 个 静态 缓冲 区 中 ， 所 以 这 个 版 本 不 是 可 重 入 的 。 如 果 两 个 线程 同时 
403 lE E A NM yo o 
调用 这 个 函数 ， 就 会 看 到 不 一 致 的 结果 
| 程序 清单 12-3 getenv 的 非 可 重 入 版 本 


#include «limits.h» 
#include <string.h> 


i static char envbuf (ARG MAX]; 
extern char **environ; 


char * 
getenv(const char *name) 


int i, len; 


len = strlen(name) ; 


for (i = 0; environ[i] != NULL; i++) { 
if ((strncmp(name, environí[i], len) == 0) && 
(environ[i] [len] == ‘=’)) { 


strcpy(envbuf, &environ [i] [len+1]); 
return (envbuf) ; 
} 
} 
return (NULL) ; 


} 


程序 清单 12-4 给 出 了 genenv 的 可 重 人 版 本 ， 这 个 版 本 命名 为 getenv_r。 它 使 用 
pthread_once@ a (FEIZO HRR) 来 确保 每 个 进程 只 调用 一 次 thread_init 函 数 。 
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程序 清单 12-4 getenv 的 可 重 入 (线程 安全 ) 版 本 


#include <string.h> 
#include «errno.h» 

#include «pthread.h» 
#include <stdlib.h> 


extern char **environ; 


pthread_mutex_t env_mutex; 
static pthread once t init done = PTHREAD ONCE INIT; 


Static void 
thread init (void) 


( 


pthread mutexattr t attr; 


pthread mutexattr init(&attr); 

pthread mutexattr settype(&attr, PTHREAD MUTEX RECURSIVE); 

pthread mutex init(&env mutex, &attr); 

pthread mutexattr destroy (&attr); 
) 
int 
getenv r(const char *name, char *buf, int buflen) 


int i, len, olen; 
pthread once(&init done, thread init); 


len = strlen(name); 
pthread mutex lock(&env mutex); 


for (i = 0; environ[i] != NULL; i++) { 
if ((strncmp (name, environ[i], len) == 0) && 
(environ[i] [len] == ’="')) { 


olen = strlen(&environ[i] [len+1]); 

if (olen >= buflen) { 
pthread_mutex_unlock (&env_mutex) ; 
return (ENOSPC) ; 


} 

strcpy (buf, &environ [i] [len+1]); 
pthread mutex unlock(&env mutex); 
return(0); 


) 
) 
pthread mutex unlock(&env mutex); 
return (ENOENT) ; 


} 


要 使 getenv_r 可 重 人 ， 需 要 改变 接口 ， 调 用 者 必须 自己 提供 缓冲 区 ， 这 样 每 个 线程 可 以 
使 用 各 自 不 同 的 缓冲 区 从 而 避免 其 他 线程 的 干扰 。 但 是 注意 这 还 不 足以 使 getenv_z 成 为 线程 
安全 的 ， 要 使 getenv_z 成 为 线程 安全 的 ， 需 要 在 搜索 请 求 的 字符 串 时 保护 环境 不 被 修改 。 我 
们 可 以 使 用 互 斥 量 ， 通 过 getenv_r 和 putenv 函 数 对 环境 列表 的 访问 进行 序列 化 。 

可 以 使 用 读 写 锁 ， 从 而 允许 对 getenv_r 的 多 次 并 发 访问 ， 但 并 发 性 的 增强 可 能 并 不 会 在 
很 大 程度 上 改善 程序 的 性 能 。 这 里 面 有 两 个 原因 : 首先 ， 环 境 列 表 通 常 不 会 很 长 ， 所 以 扫描 列 
表 时 并 不 需要 长 时 间 地 占有 互 斥 量 ， 其次， 对 getenv 和 putenv 的 调用 不 是 频繁 发 生 的 ， 所 以 
改善 它们 的 性 能 并 不 会 对 程序 的 整体 性 能 产生 很 大 的 影响 。 

即使 把 getenv_r 变 成 线程 安全 的 ， 也 并 不 意味 着 它 对 信和 号 处 理 程序 是 可 重 入 的 。 如 果 使 
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用 的 是 非 递归 的 互 斥 量 ， 当 线程 从 信号 处 理 程序 中 调用 getenv_r 上 时 ， 就 有 可 能 出 现 死 锁 。 如 
果 信 号 处 理 程序 在 线程 执行 getenv_r 时 中 断 了 该 线程 , 由 于 这 时 已 经 占有 加 锁 的 env_mutex， 
这 样 其 他 线程 试图 对 这 个 互 斥 量 的 加 锁 就 会 被 阻塞 ， 最 终 导 致 线程 进入 死 锁 状 态 。 所 以 ， 必 须 
使 用 递归 互 斥 量 阻止 其 他 线程 改变 当前 正 查看 的 数据 结构 ， 同 时 还 要 阻止 来 自信 号 处 理 程序 的 
死 锁 。 问 题 是 pthreaG 消 数 并 不 保证 是 异步 信号 安全 的 ， 所 以 不 能 把 pthread 函 数 用 于 其 他 
涌 数 ， 让 该 函数 成 为 异步 信号 安全 的 。 o 


12.6 线程 私有 数据 


线程 私有 数据 (也 称 线程 特定 数据 ) 是 存储 和 查询 与 某 个 线程 相关 的 数据 的 一 种 机 制 。 把 
这 种 数据 称 为 线程 私有 数据 或 线程 特定 数据 的 原因 是 ,希望 每 个 线程 可 以 独立 地 访问 数据 副本 ， 
而 不 需要 担心 与 其 他 线程 的 同步 访问 问题 。 

线程 模型 促进 了 进程 中 数据 和 属性 的 共享 ， 许 多 人 在 设计 线程 模型 时 会 遇 到 各 种 麻烦 。 但 
在 这 样 的 模型 中 ， 为 什么 还 需要 提出 一 些 合适 的 用 于 阻止 共享 的 接口 呢 ? 其 中 有 两 个 原因 ， 

第 一 ， 有 时 候 需 要 维护 基于 每 个 线程 的 数据 。 因 为 线程 ID 并 不 能 保证 是 小 而 连续 的 整数 ， 
所 以 不 能 简单 地 分 配 一 个 线程 数据 数组 ， 用 线程 ID 作为 数组 的 索引 。 即 使 线程 了 确实 是 小 而 连 
续 的 整数 ， 可 能 还 希望 有 一 些 额外 的 保护 ， 以 防止 某 个 线程 的 数据 与 其 他 线程 的 数据 相 混淆 。 

采用 线程 私有 数据 的 第 二 个 原因 是 : 它 提 供 了 让 基于 进程 的 接口 适应 多 线程 环境 的 机 制 。 
一 个 很 明显 的 实例 就 是 errno。 回 忆 1.7 节 中 对 errno 的 讨论 ，( 线 程 出 现 ) 以 前 的 接口 把 
errno 定 义 为 进程 环境 中 全 局 可 访问 的 整数 。 系 统 调用 和 库 例 程 在 调用 或 执行 失败 时 设置 
errno， 把 它 作 为 操作 失败 时 的 附属 结果 。 为 了 让 线程 也 能 够 使 用 那些 原本 基于 进程 的 系统 调 
用 和 库 例 程 ，errno 被 重新 定义 为 线程 私有 数据 。 这 样 ， 一 个 线程 做 了 设置 errno 的 操作 并 不 
会 影响 进程 中 其 他 线程 的 errno 值 。 

回顾 前 面 所 学 可 知 ， 进 程 中 的 所 有 线程 都 可 以 访问 进程 的 整个 地 址 空间 。 除 了 使 用 寄存 器 
以 外 ， 线 程 没 有 办 法 阻止 其 他 线程 访问 它 的 数据 ， 线 程 私 有 数据 也 不 例外 。 虽 然 底层 的 实现 部 
分 并 不 能 阻止 这 种 访问 能 力 ， 但 管理 线程 私有 数据 的 函数 可 以 提高 线程 间 的 数据 独立 性 。 

在 分 配 线程 私有 数据 之 前 ， 需 要 创建 与 该 数据 关联 的 键 。 这 个 键 将 用 于 获取 对 线程 私有 数 
据 的 访问 权 。 使 用 pthread_key_create 创 建 一 个 键 。 


#include <pthread.h> 


int pthread key create(pthread key t *keyp, 


void (*destructor) (void *)); 





返回 值 : 车 成 功 则 返回 0， 否 则 返回 错误 编号 


创建 的 键 存放 在 ieyp 指 向 的 内 存单 元 ， 这 个 键 可 以 被 进程 中 的 所 有 线程 使 用 ， 但 每 个 线程 
把 这 个 键 与 不 同 的 线程 私有 数据 地 址 进行 关联 。 创 建新 键 时 ， 每 个 线程 的 数据 地 址 设 为 null 值 。 

除了 创建 键 以 外 ，pthread_key_create 可 以 选择 为 该 键 关 联 析 构 函数 ， 当 线程 退出 时 ， 
如 果 数 据 地 址 已 经 被 置 为 非 aull 数 值 ， 那 么 析 构 函数 就 会 被 调用 ， 它 唯一 的 参数 就 是 该 数据 地 
址 。 如 果 传人 的 destructor 参 数 为 null， 就 表明 没有 析 构 函数 与 键 关联 。 当 线程 调用 pthread_ 
exit 或 者 线程 执行 返回 ， 正常 退出 时 ， 析 构 函 数 就 会 被 调用 ， 但 如 果 线 程 调用 了 exit、 
_exit、_ExXxit、abort 或 出 现 其 他 非 正 常 的 退出 时 ， 就 不 会 调用 析 构 函数 。 

线程 通常 使 用 mal1oc 为 线程 私有 数据 分 配 内 存 空 间 ， 析 构 函 数 通 常 释放 已 分 配 的 内 存 。 
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如 果 线 程 没 有 释放 内 存 就 退出 了 ， 那 么 这 块 内 存 将 会 丢失 ， 即 线程 所 属 进程 出 现 了 内 存 泄漏 。 

线程 可 以 为 线程 私有 数据 分 配 多 个 键 ， 每 个 键 都 可 以 有 一 个 析 构 函数 与 它 关 联 。 各 个 键 的 
析 构 函数 可 以 互 不 相同 ， 当 然 它们 也 可 以 使 用 相同 的 析 构 函数 。 每 个 操作 系统 在 实现 的 时 候 可 
以 对 进程 可 分 配 的 键 的 数量 进行 限制 (回忆 表 12-1 中 的 PTHREAD_KEYS_MAX)。 

线程 退出 时 ， 线 程 私有 数据 的 析 构 函数 将 按照 操作 系统 实现 中 定义 的 顺序 被 调用 。 析 构 函 
数 可 能 会 调用 另 一 个 函数 ， 该 函数 可 能 会 创建 新 的 线程 私有 数据 而 且 把 这 个 数据 与 当前 的 键 关 
联 起 来 。 当 所 有 的 析 构 函数 都 调用 完成 以 后 ， 系 统 会 检查 是 否 还 有 非 null 的 线程 私有 数据 值 与 
键 关联 ， 如 果 有 的 话 ， 再 次 调用 析 构 函数 。 这 个 过 程 将 会 一 直 重 复 直 到 线程 所 有 的 键 都 为 null 
值 线 程 私有 数据 ， 或 者 已 经 做 了 PTHREAD_DESTRUCTOR_ITERATIONS ( 见 表 12-1) 中 定义 
的 最 大 次 数 的 尝试 。 

对 所 有 的 线程 ， 都 可 以 通过 调用 pthread_key_delete 来 取消 键 与 线程 私有 数据 值 之 间 


#include <pthread.h> 


int pthread key delete (pthread key t *key); 


返回 值 ， 若 成 功 则 返回 9， 否则 返回 错误 编号 





注意 调用 pthread_key_delete 并 不 会 激活 与 键 关联 的 析 构 函数 。 要 释放 任何 与 键 对 应 的 线 
程 私 有 数据 值 的 内 存 空间 ， 需 要 在 应 用 程序 中 采取 额外 的 步 又 。 

需要 确保 分 配 的 键 并 不 会 由 于 在 初始 化 阶段 的 竞争 而 发 生变 动 。 下 列 代码 可 以 导致 两 个 线 
程 都 调用 pthread_key_create: 


void destructor(void *); 


pthread key t key; 
int init_done = 0; 


int 
threadfunc(void *arg) 
if (!init done) { 
init done - 1; 
err - pthread key create(&key, destructor); 
} 
oats 
有 些 线程 可 能 看 到 某 个 键 值 ， 而 其 他 的 线程 看 到 的 可 能 是 另 一 个 不 同 的 键 值 ， 这 取决 于 系统 是 
如 何 调度 线程 的 ， 解 决 这 种 竞争 的 办 法 是 使 用 pthread_once。 


#include <pthread.h> 


pthread once t initflag = PTHREAD ONCE INIT; 


int pthread once(pthread once t *initflag, void (*initfn) (void)); 


返回 值 ， 若 成 功 则 返回 9， 否 则 返回 错误 编号 





initflag 必 须 是 一 个 非 本 地 变量 ( 即 全 局 变量 或 静态 变量 ) ， 而 且 必 须 初始 化 为 PTHREAD_ 


ONCE_INIT, 
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如 果 每 个 线程 都 调用 pthread_once， 系 统 就 能 保证 初始 化 例 程 iitp: 只 被 调用 一 次 ， 即 


在 系统 首次 调用 pthread_once 时 。 创 建 键 时 避免 出 现 竞争 的 一 个 恰当 的 方法 可 以 描述 如 下 ， 


void destructor (void *); 


pthread key t key; 
pthread once t init done - PTHREAD ONCE INIT; 


void 
thread init(void) 


{ 
} 
int 


threadfunc (void *arg) 


{ 


err = pthread key create(&key, destructor); 


pthread once(&init done, thread init); 
) 


Rut, MAL Alpthread_setspecifichRHRABREUARES RE 
可 以 通过 pthread_getspecific 国 数 获得 线程 私有 数据 的 地 址 。 


#include <pthread.h> 


void *pthread getspecific(pthread key t key) ; 


返回 值 : 线程 私有 数据 值 ， 若 没有 值 与 键 关联 则 返回 NULL 
int pthread_setspecific(pthread_key t key, const void *value) ; 


BEE: 车 成 功 则 返回 0， 和 否则 返回 错误 编号 





如 果 没 有 线程 私有 数据 值 与 键 关联 ，pthread_getspecific 将 返回 一 个 空 指针 ， 可 以 


据 此 来 确定 是 否 需 要 调用 pthread_setspecific。 





在 程序 清单 12-3 中 ， 给 出 了 getenv 的 假设 实现 ， 接 着 又 给 出 了 一 个 新 的 接口 ， 提 供 的 功 


能 相同 ， 不 过 它 是 线程 安全 的 ( 见 程序 清单 12-4)。 但 是 如 果 无 法 修改 应 用 程序 以 直接 使 用 新 
的 接口 会 出 现 什么 问题 呢 ? 这 种 情况 下 ， 可 以 使 用 线程 私有 数据 来 维护 每 个 线程 的 数据 缓冲 区 
的 副本 ， 用 于 存放 各 自 的 返回 字符 串 ， 如 程序 清单 12-5 所 示 。 


程序 清单 12-5 线程 安全 的 getenv 的 兼容 版 本 


#include <limits.h> 
#include <string.h> 
#include <pthread.h> 
#include <stdlib.h> 


static pthread_key t key; 
static pthread once t init done = PTHREAD ONCE INIT; 
pthread mutex t env mutex - PTHREAD MUTEX INITIALIZER; 


extern char **environ; 
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static void 
thread_init (void) 


{ 
} 


char * 
getenv(const char *name) 


pthread key create(&key, free); 


int i, len; 
char *envbuf; 


pthread once(&init done, thread init); 
pthread mutex lock(&env mutex); 
envbuf - (char *)pthread getspecific(key); 
if (envbuf == NULL) { 
envbuf - malloc(ARG MAX); 
if (envbuf == NULL) { 
pthread_mutex_unlock (&env_mutex) ; 
return (NULL) ; 
} 
pthread setspecific(key, envbuf); 


) 


len = strlen(name); 


for (i = 0; environ[i] !- NULL; i++) { 
if ((strncmp(name, environ[i], len) == 0) && 
(environ[i] [len] == '=')) { 


strcpy (envbuf, &environ[i] [len+1)); 
pthread_mutex_unlock (&env_mutex) ; 
return (envbuf) ; 


} 


pthread mutex unlock(&env mutex); 
return(NULL); 


) 
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使 用 pthread_once 来 确保 只 为 将 要 使 用 的 线程 私有 数据 创建 了 一 个 键 。 如 果 pthreaa_ 
getspecific 返 回 的 是 空 指 针 ， 需 要 分 配 内 存 然后 把 键 与 该 内 存单 元 关联 ， 否 则 如 果 和 返回 的 
不 是 空 指 针 ， 就 使 用 pthread_getspecific 返 回 的 内 存单 元 。 对 析 构 函数 ， 使 用 free 来 释 
放 之 前 由 mal1loc 分 配 的 内 存 。 只 有 当 线程 私有 数据 值 为 #null 时 ， 桥 构 函 数 才 会 被 调用 。 

注意 虽然 这 个 版 本 的 getenv 是 线程 安全 的 ， 但 它 并 不 是 异步 -信号 安全 的 。 对 信和 号 处 理 程 
序 而 言 ， 即 使 使 用 递归 的 互 斥 量 ， 这 个 版 本 的 getenv 也 不 可 能 是 可 重 人 的 ， 因 为 它 调用 了 


malloc， 而 malloc 国 数 本 身 并 不 是 异步 -信号 安全 的 。 
12.7 取消 选项 


口 





有 两 个 线程 属性 并 没有 包含 在 pthread_attr_t 结 构 中 ， 它 们 是 可 取消 状态 和 可 取消 类 


型 。 这 两 个 属性 影响 着 线程 在 响应 pthread_cance1 函数 调用 时 所 呈现 的 行为 ( 见 11.5 节 )。 


可 取消 状态 属性 可 以 是 PTHREAD_CANCEL_ENABLE， 也 可 以 是 PTHREAD_ 


CANCEL_DISABLE。 线 程 可 以 通过 调用 pthreaqd_setcancelstate 修 改 它 的 可 取消 状态 。 


#include <pthread.h> 


int pthread setcancelstate(int state, int *oldstate) ; 


返回 值 : 车 成 功 则 返回 0， 和 否则 返回 错误 编号 
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pthread setcancelstate 把 当前 的 可 取消 状态 设置 为 state， 把 原来 的 可 取消 状态 存放 在 由 
oldstate 指 向 的 内 存单 元 中 ， 这 两 步 是 原子 操作 。 

回顾 11.5 节 ，pthread_cance1 调 用 并 不 等 待 线程 终止 ， 在 默认 情况 下 ,线程 在 取消 请 求 
发 出 以 后 还 是 继续 运行 ， 直 到 线程 到 达 某 个 取消 点 。 取 消 点 是 线程 检查 是 否 被 取消 并 按照 请 求 
进行 动作 的 一 个 位 置 。POSIX.1 保 证 在 线程 调用 表 12-7 中 列 出 的 任何 函数 时 ， 取 消 点 都 会 出 现 。 


表 12-7 POSIX.1 定 义 的 取消 点 


accept mq timedsend putpmsg sigsuspend 
aio_suspend msgrcv pwrite sigtimedwait 
Clock nanosleep | msgsnd read sigwait 
close msync readv sigwaitinfo 
connect nanosleep recv sleep 

creat open recvfrom system 
fcnt12 pause recvmsg tcdrain 
fsync poll select usleep 
getmsg pread sem timedwait wait 

getpmsg pthread cond timedwait | sem wait waitid 


lockf pthread cond wait send waitpid 
mq receive pthread join sendmsg write 
mq send pthread testcancel sendto writev 
mq timedreceive | putmsg sigpause 





线程 启动 时 默认 的 可 取消 状态 是 PTHREAD_CANCEL_ENABLE。 当 状态 设 为 PTHREAD_ 
CANCEL_DISABLE 了 时， 对 pthread_cance1 的 调用 并 不 会 杀 死 线程 ， 相 反 ， 取 消 请 求 对 这 个 
线程 来 说 处 于 未 决 状态 。 当 取消 状态 再 次 变 为 PTHREAD_CANCEL_ENABLE 时 ， 线 程 将 在 下 一 
个 取消 点 上 对 所 有 未 决 的 取消 请 求 进行 处 理 。 

除了 表 12-7 中 列 出 的 函数 ，POSIX.1 还 指定 了 表 12-8 中 列 出 的 函数 作为 可 选 的 取消 点 。 


注意 表 12-8 中 列 出 的 有 些 函 数 并 没有 在 本 书 中 进一步 讨论 。 许 多 函数 在 Single UNIX Specification 
中 是 可 选 的 。 


如 果 应 用 程序 在 很 长 一 段 时 间 内 都 不 会 调用 到 表 12-7 或 表 12-8 中 的 函数 (例如 计算 数学 领 
域 的 应 用 程序 )， 那 么 可 以 调用 pthread_testcance1 函 数 在 程序 中 自己 添加 取消 点 。 


#include <pthread.h> 
void pthread testcancel (void); 


调用 pthread_testcancel 时 ,如果 有 某 个 取消 请 求 正 处 于 未 决 状态 ， 而 且 取 消 并 没有 
置 为 无 效 ， 那 么 线程 就 会 被 取消 。 但 是 如 果 取 消 被 置 为 无 效 时 ，pthread_testcance1l 调 用 
就 没有 任何 效果 。 

这 里 所 描述 的 默认 取消 类 型 也 称 为 延迟 取消 。 调 用 pthread_cancel 以 后 ， 在 线程 到 达 
取消 点 之 前 ， 并 不 会 出 现 真 正 的 取消 。 可 以 通过 调用 pthread_setcanceltype 来 修改 取消 
类 型 。 


#include <pthread.h> 


int pthread setcanceltype(int type, int *oldtype) ; 


返回 值 : 若 成 功 则 返回 0， 否 则 返回 错误 编号 
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$12-8 POSIX.1 定 义 的 可 选取 消 点 


catclose 
catgets 
catopen 
closedir 
closelog 
Ctermid 
dbm close 
dbm delete 
dbm fetch 
dbm nextkey 
dbm open 
dbm store 
diclose 
dlopen 
endgrent 
endhostent 
endnetent 
endprotoent 
endpwent 
endservent 


endutxent 
fclose 
fcntl 


ftell 

ftello 

ftw 

fwprintf 
fwrite 
fwscanf 

getc 

getc unlocked 
getchar 
getchar unlocked 
getcwd 
getdate 
getgrent 
getgrgid 
getgrgid r 
getgrnam 
getgrnam r 
gethostbyaddr 
gethostbyname 
gethostent 
gethostname 
getlogin 
getlogin r 


getwe 

getwchar 

getwd 

glob 

iconv_close 
iconv_open 

ioctl 

lseek 

mkstemp 

nftw 

opendir 

openlog 

pclose 

perror 

popen 

posix fadvise 
posix fallocate 
posix madvise 
posix spawn 
posix spawnp 
posix trace clear 
posix trace close 
posix trace create 


printf 

putc 

putc unlocked 
putchar 
putchar unlocked 
puts 
pututxline 
putwc 
putwchar 
readdir 
readdir r 
remove 
rename 
rewind 
rewinddir 
scanf 
seekdir 
semop 
setgrent 
sethostent 
setnetent 
setprotoent 
setpwent 





fflush 
fgetc getnetbyname 


getnetbyaddr posix trace create withlog setservent 
posix trace eventtypelist getnext id | setutxent 
fgetpos getnetent posix trace eventtypelist rewind strerror 
fgets getprotobyname posix_trace_flush syslog 
fgetwc getprotobynumber | posix trace get attr tmpfile 
fgetws getprotoent posix trace get filter tmpnam 
fopen getpwent posix trace get status ttyname 
fprintf getpwnam posix trace getnext event ttyname r 
fputc getpwnam r posix trace open ungetc 
fputs getpwuid posix trace rewind ungetwc 
fputwc getpwuid r posix trace set filter unlink 
fputws gets posix trace shutdown vfprintf 
fread getservbyname posix trace timedgetnext event vfwprintf 
freopen getservbyport posix typed mem open vprintf 
fscanf getservent pthread rwlock rdlock vwprintf 
fseek getutxent pthread rwlock timedrdlock wprintf 
fseeko getutxid pthread rwlock timedwrlock wscanf 
fsetpos getutxline pthread rwlock wrlock 





type BR a LAE PTHREAD_CANCEL_DEFERRED, 4L "[LAJÉPTHREAD CANCEL. 
ASYNCHRONOUS, ，bthread_setcanceltype 图 数 把 取消 类 型 设置 为 ype， 把 原来 的 取消 类 
型 返回 到 oldtype 指 向 的 整 型 单元 。 

异步 取消 与 延迟 取消 不 同 ， 使 用 异步 取消 上 时， 线程 可 以 在 任意 时 间 取 消 ， 而 不 是 非得 遇 到 
取消 点 才能 被 取消 。 


12.8 ”线程 和 信号 


即使 是 在 基于 进程 的 编程 模式 中 ， 信 号 的 处 理 也 可 能 是 很 复杂 的 。 把 线程 引入 编程 范 型 ， 
就 使 信号 的 处 理 变 得 更 加 复杂 。 

每 个 线程 都 有 自己 的 信号 屏蔽 字 ， 但 是 信号 的 处 理 是 进程 中 所 有 线程 共享 的 。 这 意味 着 尽管 
单个 线程 可 以 阻止 某 些 信 号 ， 但 当 线 程 修改 了 与 某 个 信号 相关 的 处 理 行为 以 后 ， 所 有 的 线程 都 必 
须 共 享 这 个 处 理 行为 的 改变 。 这 样 如 果 一 个 线程 选择 忽略 某 个 信号 ， 而 其 他 的 线程 可 以 恢复 信号 
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的 默认 处 理 行为 ， 或 者 为 信号 设置 一 个 新 的 处 理 程序 ， 从 而 可 以 撤销 上 述 线程 的 信号 选择 。 

进程 中 的 信号 是 递送 到 单个 线程 的 。 如 果 信 号 与 硬件 故障 或 计时 器 超时 相关 ， 该 信号 就 被 
发 送 到 引起 该 事件 的 线程 中 去 ， 而 其 他 的 信号 则 被 发 送 到 任意 一 个 线程 。 

10.12 节 讨论 了 进程 如 何 使 用 sigprocmask 来 阻止 信号 发 送 。sigprocmask 的 行为 在 多 
线程 的 进程 中 并 没有 定义 ， 线 程 必须 使 用 pthread_sigmask。 


#include <signal.h> 


int pthread sigmask (int how, const sigset_t *restrict set, 


Sigset t *restrict oset); 


BE: 车 成 功 则 返回 0， 和 否则 返回 错误 编号 





pthread_sigmaskma& 5jsigorocmask(fi Zi SER ARIS], K T pthread sigmask T EE 
程 中 ， 并 且 失 败 时 返回 错误 码 ， 而 不 像 sigprocmask 中 那样 设置 errno 并 返回 -1。 

线程 可 以 通过 调用 sigwait 等 待 一 个 或 多 个 信号 发 生 。 

#include <signal.h> 


int sigwait (const sigset t *restrict set, int *restrict signop) ; 


BEE: 车 成 功 则 返回 0， 否则 返回 错误 编号 





set 参 数 指出 了 线程 等 待 的 信号 集 ，signop 指 向 的 整数 将 作为 返回 值 ， 表 明 发 送信 号 的 数量 。 

如 果 信 号 集中 的 某 个 信号 在 sigwait 调 用 的 时 候 处 于 未 决 状 态 ， 那 么 sigwait 将 无 阻塞 
地 返回 ， 在 返回 之 前 ，sigwait 将 从 进程 中 移 除 那些 处 于 未 决 状态 的 信号 。 为 了 避免 错误 动作 
发 生 ， 线 程 在 调用 sigwait 之 前 ， 必 须 阻塞 那些 它 正在 等 待 的 信号 。sigwait 函 数 会 自动 取 
消 信 号 集 的 阻塞 状态 ， 直 到 有 新 的 信号 被 递送 。 在 返回 之 前 ，sigwait 将 恢复 线程 的 信号 屏蔽 
字 。 如 果 信 和 号 在 sigwait 调 用 的 时 候 没 有 被 阻塞 ， 在 完成 对 sigwait 调 用 之 前 会 出 现 一 个 时 
间 窗 ， 在 这 个 窗口 期 ， 某 个 信号 可 能 在 线程 完成 sigwait 调 用 之 前 就 被 递送 了 。 

使 用 sigwait 的 好 处 在 于 它 可 以 简化 信号 处 理 , 允许 把 异步 产生 的 信号 用 同步 的 方式 处 理 。 
为 了 防止 信号 中 断 线 程 ， 可 以 把 信号 加 到 每 个 线程 的 信号 屏蔽 字 中 ， 然 后 安排 专用 线程 作 信 和 号 
处 理 。 这 些 专用 线程 可 以 进行 函数 调用 ， 不 需要 担心 在 信号 处 理 程序 中 调用 哪些 函数 是 安全 的 ， 
因为 这 些 函 数 调用 来 自 正常 的 线程 环境 ， 而 非 传 统 的 信号 处 理 程 序 ， 传 统 信 号 处 理 程序 通常 会 
中 断 线程 的 正常 执行 。 

如 果 多 个 线程 在 sigwait 调 用 时 ， 等 待 的 是 同一 个 信号 ， 这 时 就 会 出 现 线程 阻塞 。 当 信和 号 
递送 的 时 候 ， 只 有 一 个 线程 可 以 从 sigwait 中 返回 。 如 果 信 和 号 被 捕获 (例如 进程 通过 使 用 
sigaction 建 立 了 一 个 信号 处 理 程 序 ) ， 而 且 线程 正在 sigwait 调 用 中 等 待 同一 信号 ， 那 么 这 
时 将 由 操作 系统 实现 来 决定 以 何 种 方式 递送 信号 。 在 这 种 情况 下 ， 操 作 系 统 实现 可 以 让 
sigwait 返 回 ， 也 可 以 激活 信号 处 理 程序 ， 但 不 可 能 出 现 两 者 皆 可 的 情况 。 

要 把 信号 发 送 到 进程 ， 可 以 调用 ki1l1 ( 见 10.9 节 ) ， 要 把 信和 号 发 送 到 线程 ， 可 以 调用 
pthread_kill, 


#include «signal.h» 


int pthread kill(pthread t thread, int signo); 
返回 值 : 车 成 功 则 返回 9， 否 则 返回 错误 编号 
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可 以 传 一 个 0 值 的 signo 来 检查 线程 是 否 存 在 。 如 果 信 号 的 默认 处 理 动 作 是 终止 该 进程 ， 那 
么 把 信号 传递 给 某 个 线程 仍然 会 杀 掉 整个 进程 。 

注意 闹钟 定时 器 是 进程 资源 ， 并 且 所 有 的 线程 共享 相同 的 alarm。 所 以 进程 中 的 多 个 线程 不 
可 能 互 不 干扰 (或 互 不 合作 ) 地 使 用 闹钟 定时 器 (这 是 习题 12.6 的 内 容 )。 











回忆 程序 清单 10-16， 等 待 信号 处 理 程序 设置 标志 ， 从 而 表明 主 程序 应 该 退出 。 唯 一 可 运行 
的 控制 线程 就 是 主线 程 和 信号 处 理 程序 ， 所 以 阻塞 信号 足以 避免 错失 标志 修改 。 在 线程 中 ， 需 
要 使 用 互 斥 量 来 保护 标志 ， 如 程序 清单 12-6 所 示 。 


程序 清单 12-6 同步 信号 处 理 


#include "apue.h" 
#include <pthread.h> 


int quitflag; /* set nonzero by thread */ 
sigset t mask; 


pthread mutex t lock - PTHREAD MUTEX INITIALIZER; 
pthread cond t wait - PTHREAD COND INITIALIZER; 


void * 
thr fn(void *arg) 


{ 


int err, signo; 


for (;;) { 
err = sigwait (émask, &signo); 
if (err != 0) 


err_exit(err, "sigwait failed"); 
switch (signo) { 
case SIGINT: 

printf ("\ninterrupt\n") ; 

break; 


case SIGQUIT: 
pthread_mutex_lock (&lock) ; 
quitflag = 1; 
pthread_mutex_unlock (&lock) ; 
pthread_cond_signal (&wait) ; 
return (0) ; 


default: 
printf (“unexpected signal $dWMn", signo); 
exit (1); 


} 
int 
main (void) 


int err; 
sigset_t oldmask; 
pthread t tid; 


sigemptyset (&mask) ; 
Sigaddset (&mask, SIGINT); 
sigaddset (&mask, SIGQUIT); 


bbs.theithome.com 


A 


wa 


336 $123 线程 控制 


if ((err = pthread sigmask(SIG BLOCK, &mask, &oldmask)) != 0) 
err exit(err, "SIG BLOCK error"); 


err - pthread create(&tid, NULL, thr fn, 0); 
if (err != 0) 
err exit(err, "can't create thread"); 


pthread mutex lock(&lock); 

while (quitflag == 0) 
pthread cond wait(&wait, &lock); 

pthread mutex unlock (&lock) ; 


/* SIGQUIT has been caught and is now blocked; do whatever */ 
qüitflag = 0; 


/* reset signal mask which unblocks SIGQUIT */ 

if (sigprocmask(SIG SETMASK, &oldmask, NULL) « 0) 
err Sys("SIG SETMASK error"); 

exit (0); 


) 


这 里 并 不 让 信号 处 理 程 序 中 断 主 控 线程 ， 而 是 由 专门 的 独立 控制 线程 进行 信号 处 理 。 改 动 
quitflag 的 值 是 在 互 斥 量 的 保护 下 进行 的 ， 这 样 主 控 线程 不 会 在 调用 pthread_cond_ 
signal 时 错失 唤醒 调用 。 在 主 控 线程 中 使 用 相同 的 互 斥 量 来 检查 标志 的 值 ， 并 且 原 子 地 释放 
互 斥 量 ， 等 待 条 件 的 发 生 。 

注意 在 主线 程 开 始 时 阻塞 SIGINT 和 SIGQUIT。 当 创建 线程 进行 信号 处 理 时 ， 新 建 线程 继 
承 了 现 有 的 信号 屏蔽 字 。 因 为 sigwait 会 解除 信号 的 阻塞 状态 ， 所 以 只 有 一 个 线程 可 以 用 于 信 
号 的 接收 。 这 使 得 对 主线 程 进行 编码 时 不 必 担心 来 自 这 些 信号 的 中 断 。 

运行 这 个 程序 可 以 得 到 与 程序 清单 10-16 类 似 的 输出 结果 : 





$ ./a.out 


? 键入 中 断 字符 
interrupt 
Qi? 再 次 键入 中 断 字符 
interrupt 
ae 再 一 次 
interrupt 
^ S 用 结束 字符 终止 


LJ 


Linux 线 程 是 以 独立 进程 实现 的 ， 使 用 clone(2) 共 享 资 源 。 因 此 Linux 线 程 在 遇 到 信号 时 的 行为 与 
其 他 操作 季 统 实现 不 同 。 在 POSIX.1 线 程 模型 中 ， 骨 步 信 号 被 发 送 到 进程 以 后 ， 进 程 中 当前 没有 阻塞 该 
信号 的 某 个 线程 就 被 选中 ， 接 收 信号 。 在 LinuxX 上， 异步 信号 发 送 到 圣 定 的 线程 ， 而 且 因 为 每 个 线程 是 
作为 独立 的 进程 执行 的 ， 系 统 就 不 能 选择 当前 没有 阻塞 该 信号 的 线程 。 这 样 一 来 ， 结 果 就 是 线程 可 能 
不 会 注意 到 该 信号 。 因 此 ， 如 果 信 号 产生 于 终端 驱动 程序 ， 这 样 的 信号 是 通知 到 进程 组 的 ， 像 程序 清 
单 12-6 中 的 程序 就 可 以 工作 ;但 是 如 果 试图 用 kil1 把 信号 发 送 给 进程 时 ， 在 Linux 上 就 不 能 如 预期 的 那 
样 工作 。 


12.9 线程 和 fork 
当 线程 调用 fcrk 时 ， 就 为 子 进 程 创建 了 整个 进程 地 址 空间 的 副本 。 回 忆 8.3 节 中 讨论 的 写 


时 复制 ， 子 进程 与 父 进程 是 完全 不 同 的 进程 ， 只 要 两 者 都 没有 对 内 存 做 出 改动 ， 父 进程 和 子 进 
程 之 间 还 可 以 共享 内 存 页 的 副本 。 
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子 进 程 通过 继承 整个 地 址 空间 的 副本 ， 也 从 父 进程 那里 继承 了 所 有 互 斥 量 、 读 写 锁 和 条 件 
变量 的 状态 。 如 果 父 进程 包含 多 个 线程 ， 子 进程 在 Eork 返 回 以 后 ， 如 果 紧 接着 不 是 马上 调用 
exec 的 话 ， 就 需要 清理 锁 状 态 。 

在 子 进程 内 部 只 存在 一 个 线程 ， 它 是 由 父 进程 中 调用 fork 的 线程 的 副本 构成 的 。 如 果 父 
进程 中 的 线程 占有 锁 ， 子 进程 同样 占有 这 些 锁 。 问 题 是 子 进程 并 不 包含 占有 锁 的 线程 的 副本 ， 
所 以 子 进 程 没 有 办 法 知道 它 占 有 了 哪些 锁 并 且 需 要 释放 哪些 锁 。 

如 果子 进程 从 fork 返 回 以 后 马上 调用 某 个 exec 函 数 ， 就 可 以 避免 这 样 的 问题 。 这 种 情况 
下 ， 老 的 地 址 空间 被 丢弃 ， 所 以 锁 的 状态 无 关 紧 要 。 但 如 果子 进程 需要 继续 做 处 理工 作 的 话 ， 
这 种 方法 就 行 不 通 ， 还 需要 使 用 其 他 的 策略 。 

要 清除 锁 状 态 ， 可 以 通过 调用 pthread_atfork 函 数 建 立 fork 处 理 程序 。 


#include <pthread.h> 


int pthread_atfork(void (*prepare) (void), void (*parent) (void), 


void (*child) (void)); 
返回 值 : 车 成 功 则 返回 0， 否 则 返回 错误 编号 





用 pthread_atfork 限 数 最 多 可 以 安装 三 个 帮助 清理 锁 的 函数 。prepare fork 处 理 程序 由 
父 进程 在 fork 创 建 子 进程 前 调用 ， 这 个 fork 处 理 程 序 的 任务 是 获取 父 进 程 定义 的 所 有 锁 。 
parent fork 处 理 程 序 是 在 fork 创 建 了 子 进程 以 后 ， 但 在 fork 返 回 之 前 在 父 进程 环境 中 调用 的 ， 
这 个 fork 处 理 程序 的 任务 是 对 prepare fork 处 理 程 序 获得 的 所 有 销 进行 解锁 。child fork 处 理 程序 
在 fork 返 回 之 前 在 子 进程 环境 中 调用 ， 与 parent fork 处 理 程序 一 样 ，child fork 处 理 程 序 也 必须 
释放 prepare fork 处 理 程序 获得 的 所 有 销 。 

注意 不 会 出 现 加 锁 一 次 解锁 两 次 的 情况 ， 虽 然 看 起 来 也 许 会 出 现 。 当 子 进 程 地 址 空间 创建 
的 时 候 ， 它 得 到 了 父 进程 定义 的 所 有 锁 的 副本 。 因 为 prepare fork 处 理 程序 获取 所 有 的 锁 ， 父 进 
程 中 的 内 存 和 子 进 程 中 的 内 存 内 容 在 开始 的 时 候 是 相同 的 。 当 父 进程 和 子 进程 对 他 们 的 锁 的 副 
本 进行 解锁 的 时 候 ， 新 的 内 存 是 分 配给 子 进程 的 ， 父 进程 的 内 存 内 容 被 复制 到 子 进程 的 内 存 中 
( 写 时 复制 )， 所 以 就 会 陷入 这 样 的 假象 ， 看 起 来 父 进程 对 它 所 有 的 锁 的 副本 进行 了 加 锁 ， 子 进 
程 对 它 所 有 的 锁 的 副本 进行 了 加 锁 。 父 进程 和 子 进程 对 在 不 同 内 存 位 置 的 重复 的 锁 都 进行 了 解 
锁 操 作 ， 就 好 像 出 现 了 下 列 的 事件 序列 ; 

(1) 父 进程 获得 所 有 的 锁 。 

(2) 子 进程 获得 所 有 的 锁 。 

(3) 父 进程 释放 它 的 锁 。 

(4) 子 进程 释放 它 的 锁 。 

可 以 多 次 调用 pthread_atfork 函 数 从 而 设置 多 套 fork 处 理 程 序 。 如 果 不 需 要 使 用 其 中 某 
个 处 理 程序 ， 可 以 给 特定 的 处 理 程 序 参 数 传人 空 指针 ， 这 样 它 就 不 会 起 任何 作用 。 使 用 多 个 
fork 处 理 程序 时 ， 处 理 程 序 的 调用 顺序 并 不 相同 。parent 和 child fork 处 理 程序 是 以 它们 注册 时 的 
顺序 进行 调用 的 ， 而 prepare fork 处 理 程序 的 调用 顺序 与 它们 注册 时 的 顺序 相反 。 这 样 可 以 允许 
多 个 模块 注册 它们 自己 的 fork 处 理 程序 ， 并 且 保持 锁 的 层次 。 

例如 ， 假 设 模块 A 调用 模块 B 中 的 函数 ， 而 且 每 个 模块 有 自己 的 一 套 锁 。 如 果 锁 的 层次 是 A 
在 B 之 前 ， 模 块 B 必 须 在 模块 A 之 前 设置 fork 处 理 程序 。 当 父 进程 调用 fork 时 ， 就 会 执行 以 下 的 
步骤 ， 假 设 子 进程 在 父 进程 之 前 运行 。 
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(1) 调用 模块 A 的 prepare fork 处 理 程序 获取 模块 A 的 所 有 锁 。 

(2) 调用 模块 B 的 prepare fork 处 理 程序 获取 模块 B 的 所 有 锁 。 

(3) 创建 子 进 程 。 

(4) 调用 模块 B 中 的 child fork 处 理 程序 释放 子 进 程 中 模块 B 的 所 有 锁 。 

(5) 调用 模块 A 中 的 child fork 处 理 程序 释放 子 进程 中 模块 A 的 所 有 锁 。 

(6) fork 函 数 返回 到 子 进 程 。 

(7) 调用 模块 B 中 的 parent fork 处 理 程序 释放 父 进 程 中 模块 B 的 所 有 锁 。 

(8) 调用 模块 A 中 parent fork 处 理 程序 来 释放 父 进程 中 模块 A 的 所 有 锁 。 

(9) fork Sk El fi de. 

如 果 fork 处 理 程 序 是 为 了 清理 锁 状 态 ， 那 么 又 由 谁 来 负责 清理 条 件 变 量 的 状态 呢 ? 在 有 些 
操作 系统 的 实现 中 ， 条 件 变 量 可 能 并 不 需要 做 任何 清理 。 但 是 有 些 操作 系统 实现 把 锁 作为 条 件 
变量 实现 的 一 部 分 ， 这 种 情况 下 的 条 件 变 量 就 需要 清理 。 问 题 是 目前 不 存在 这 样 的 接口 允许 做 
锁 的 清理 工作 ， 如 果 锁 是 娆 人 到 条 件 变量 的 数据 结构 中 的 ， 那 么 在 调用 fork 之 后 就 不 能 使 用 
条 件 变 量 ， 因 为 还 没有 可 移植 的 方法 对 锁 进 行 状态 清理 。 另 外 ， 如 果 操 作 系 统 的 实现 是 使 用 全 
局 锁 保 护 进程 中 所 有 的 条 件 变 量 数据 结构 ， 那 么 操作 系统 实现 本 身 可 以 在 fork 库 例 程 中 做 清 
理 锁 的 工作 ,但 是 应 用 程序 不 应 该 依赖 操作 系统 实现 中 这 样 的 细节 。 








程序 清单 12-7 中 的 程序 描述 了 如 何 使 用 pthread_atfork 和 fork 处 理 程 序 。 


程序 清单 12-7 pthread atfork 实 例 


#include "apue.h" 
#include <pthread.h> 


pthread mutex t lockl = PTHREAD MUTEX INITIALIZER; 
pthread mutex t lock2 - PTHREAD MUTEX INITIALIZER; 


void 
prepare (void) 


printf ("preparing locks... Wn"); 
pthread mutex lock (&lock1) ; 
pthread mutex lock(&lock2); 


} 
void 
parent (void) 


printf ("parent unlocking locks...\n"); 
pthread_mutex_unlock (&lock1) ; 
pthread mutex unlock(&lock2); 


void 
child(void) 


printf ("child unlocking locks...\n"); 
pthread_mutex_unlock (&lock1) ; 
pthread mutex unlock(&lock2); 


) 


void * 
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thr_fn(void *arg) 


printf ("thread started...\n"); 
pause (); 
return (0); 


} 
int 
main (void) 


int err; 
pid t pid; 
pthread t tid; 
#if defined(BSD) || defined(MACOS) 
printf("pthread atfork is unsupported |n"); 
#else 
if ((err = pthread_atfork (prepare, parent, child)) != 0) 


err_exit (err, "can't install fork handlers"); 
err = pthread_create(&tid, NULL, thr_fn, 0); 


if (err != 0) 
err_exit(err, "can’t create thread"); 
sleep (2); 


printf ("parent about to fork...\n"); 
if ((pid = fork()) < 0) 
err quit ("fork failed"); 
else if (pid == 0) /* child */ 
printf ("child returned from fork\n"); 
else /* parent */ 
printf ("parent returned from fork\n") ; 
#endif 
exit (0); 
} 





程序 中 定义 了 两 个 互 斥 量 ，l1ock1 和 1ock2，prepare fork 处 理 程序 获取 这 两 把 锁 ，child 
fork 处 理 程序 在 子 进程 环境 中 释放 锁 ，parent fork 处 理 程序 在 父 进程 中 释放 锁 。 

运行 该 程序 ， 得 到 如 下 输出 : 

$ ./a.out 

thread started... 

parent about to fork... 

preparing locks... 

child unlocking locks... 

child returned from fork 


parent unlocking locks... 
parent returned from fork 


可 以 看 出 ，prepare fork 处 理 程序 在 调用 fork 以 后 运行 ，child fork 处 理 程 序 在 fork 调 用 返 
回 到 子 进程 之 前 运行 ，parent fork 处 理 程序 在 fork 调 用 返回 给 父 进程 前 运行 。 Oo 
12.10 线程 和 i/O 


在 3.11 节 中 介绍 了 pread 和 pwrite 函 数 ， 这 些 函 数 在 多 线程 环境 下 是 非常 有 帮助 的 ， 因 
为 进程 中 的 所 有 线程 共享 相同 的 文件 描述 符 。 
考虑 两 个 线程 ， 在 同一 时 间 对 同一 个 文件 描述 符 进行 读 写 操作 。 
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线程 A 线程 B 
lseek (fd, 300, SEEK SET); lseek(fd, 700, SEEK SET); 
read(fd, buf1, 100); read(fd, buf2, 100); 


如 果 线 程 A 执 行 ]seek， 然 后 线程 B 在 线程 A 调用 read 之 前 调用 lseek， 那 么 两 个 线程 最 终 会 
读 取 同一 条 记录 。 很 显然 这 不 是 我 们 希望 的 。 
为 了 解决 这 个 问题 ， 可 以 使 用 pread， 使 偏 移 量 的 设 定 和 数据 的 读 取 成 为 一 个 原子 操作 。 
线程 A 线程 B 
pread(fd, bufi, 100, 300); pread(fd, buf2, 100, 700); 
使 用 pread 可 以 确保 线程 A 读 取 偏 移 量 为 300 的 记录 ， 而 线程 B 读 取 偏 移 量 为 700 的 记录 。 可 以 
使 用 pwrite 来 解决 并 发 线程 对 同一 文件 进行 写 操作 的 问题 。 


12.11 hÆ 


在 UNIX 系 统 中 ， 线 程 提供 了 分 解 并 发 任务 的 一 种 替代 模型 。 线 程 促进 了 独立 控制 线程 之 
间 的 共享 ， 但 也 带 来 了 它 特有 的 同步 问题 。 本 章 中 ,我 们 考查 了 如 何 调整 线程 和 它们 的 同步 原 
语 ， 讨 论 了 线程 的 可 重 入 性 ， 还 学 习 了 线程 如 何 与 其 他 面向 进程 的 系统 调用 进行 交互 。 
习题 
12.1 在 Linux 系 统 中 运行 程序 清单 12-7 中 的 程序 ， 但 把 输出 结果 重 定向 到 文件 中 ， 并 解释 结果 。 
12.2 实现 putenv_r， 即 putenv 的 可 重 人 版本。 确保 实现 既是 线程 安全 的 ， 也 是 异步 信号 安 
全 的 。 
123 是 否 可 以 通过 在 函数 开始 的 时 候 阻塞 信号 ， 并 在 函数 返回 之 前 恢复 原来 的 信号 屏蔽 字 这 
种 方法 ， 让 程序 清单 12-5 中 的 程序 变 成 异步 信号 安全 的 ? 解释 其 原因 。 
124 写 一 个 程序 运用 程序 清单 12-5 中 的 getenv 版 本 ， 在 FreeBSD 上 编译 并 运行 读 程 序 ， 会 出 
现 什么 结果 ?解释 其 原因 。 
12.5 假设 可 以 在 一 个 程序 中 创建 多 个 线程 执行 不 同 的 任务 ， 为 什么 还 是 有 可 能 会 用 fork? 解 
释 其 原因 。 
12.6 重新 实现 程序 清单 10-21 中 的 程序 ， 在 不 使 用 nanosleep 的 情况 下 使 它 成 为 线程 安全 的 。 
12.7 调用 fork 以 后 ， 是 否 可 以 通过 首先 用 pthread_cond_destroy 销 毁 条 件 变 量 ， 然 后 用 


pthread_cond_init 初 始 化 条 件 变量 这 种 方法 ， 安 全 地 在 子 进程 中 对 条 件 变 量 进行 重 
新 初始 化 ? 
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13.1 引言 


守护 进程 也 称 精 灵 进 程 (daemon) 是 生存 期 较 长 的 一 种 进程 。 它 们 常常 在 系统 自 举 时 启动 ， 
仅 在 系统 关闭 时 才 终 止 。 因 为 它们 没有 控制 终端 ， 所 以 说 它们 是 在 后 台 运 行 的 。UNIX 系 统 有 
很 多 守护 进程 ， 它 们 执行 日 常事 务 活动 。 

本 章 说 明 守 护 进程 的 结构 ， 以 及 如 何 编写 守护 进程 程序 。 因 为 守护 进程 没有 控制 终端 ， 我 
们 需要 了 解 在 出 现 问题 时 ， 守 护 进 程 如 何 报告 出 错 情况 。 


有 关 术 语 daemon 如 何 用 于 计算 机 系统 的 历史 背景 ,参见 Raymond[1996]。 


13.2 守护 进程 的 特征 


先 来 查看 一 些 常用 的 系统 守护 进程 ， 以 及 它们 怎样 和 第 9 章 中 所 叙述 的 进程 组 、 控 制 终端 
和 会 话 等 概念 相关 联 。ps(1) 命 令 打印 系统 中 各 个 进程 的 状态 。 该 命令 有 多 个 选项 ， 有 关 细 节 
请 参考 系统 手册 。 为 了 解 本 节 讨论 中 所 需 的 信息 ， 在 基于 BSD 的 系统 下 执行 : 

ps -axj 
选项 -a 显示 由 其 他 用 户 所 拥有 的 进程 的 状态 。-x 显 示 没 有 控制 终端 的 进程 状态 。-j 显 示 与 作 
业 有 关 的 信息 : 会 话 ID、 进 程 组 ID、 控 制 终端 以 及 终端 进程 组 ID。 在 基于 系统 V 的 系统 中 ,与 
此 相 类 似 的 命令 是 ps-efjc (为 了 提高 安全 性 ， 某 些 UNIX 系 统 不 允许 用 户 使 用 ps 命令 查看 不 
属于 自己 的 进程 )。ps 的 输出 大 致 是 : 


PPID PID PGID SID TTY TPGID UID COMMAND 


0 1 0 022 1 init 


0 
1 2 1 I? -1 0 [keventd] 
1 3 1 12? -1 0  [kapmd] 
0 5 1 12 al 0 [kswapd] 
0 6 1 152 Sf 0 [baf lush] 
0 7 T 1:2 zT 0 [kupdated] 
1 1009 1009 1009 ? -1 32  portmap 
1 1048 1048 1048 ? -1 0 syslogd -m 0 
1551335 31335 0133592 -1 0 xinetd -pidfile /var/run/xinetd.pid 
1 1403 T 122 zd 0 [nfsd] 
1 1405 T 1:12 =1 0 [lockd] 
1405 1406 1 2e =I 0 [rpciod] 
Ly 1853) —T853 1853.2 -1 0 crond 
1 2182 2182 2182 ? -1 0 /usr/sbin/cupsd 


其 中 ， 已 移 去 了 一 些 我 们 并 无 兴趣 的 列 ， 例 如 累计 CPU 时 间 。 按 照 顺 序 ， 各 列 标题 的 意义 是 : 
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父 进程 ID、 进 程 ID、 进 程 组 ID、 会 话 ID、 终 端 名 称 、 终 端 进程 组 ID (与 该 控制 终端 相关 的 前 台 
进程 组 )、 用 户 ID 以 及 命令 字符 串 。 


此 ps 命令 在 支持 会 话 [D 的 系统 (Linux) 上 运行 ，9.5 节 的 setsiq 函 数 中 曾 提 及 会 话 ID。 它 是 会 话 
首 进程 的 进程 ID。 但 是 ， 基 于 BSD 的 系统 将 打印 与 本 进程 所 属 进程 组 对 应 的 session 结 构 的 地 址 ( 殉 
9.117%), 


系统 进程 依赖 于 操作 系统 实现 。 父 进程 ID 为 0 的 各 进程 通常 是 内 核 进程 ， 它 们 作为 系统 自 举 
过 程 的 一 部 分 而 启动 。(init 是 此 种 进程 的 例外 ， 它 是 内 核 在 自 举 时 启动 的 用 户 层 命令 。) 内 核 
进程 是 特殊 的 ,通常 存 在 于 系统 的 整个 生命 期 中 。 它 们 以 超级 用 户 特权 运行 ， 无 控制 终端 ， 无 
命令 行 。 

进程 1 通常 是 init， 我 们 已 在 8.2 节 对 此 作 过 说 明 。 它 是 一 个 系统 守护 进程 ， 负 责 启 动 各 运 
行 层 次 特定 的 系统 服务 。 这 些 服 务 通常 是 在 它们 自己 拥有 的 守护 进程 的 帮助 下 实现 的 。 

在 Linux 下 ，keventd 守 护 进程 为 在 内 核 中 运行 计划 执行 的 函数 提供 进程 上 下 文 。kapma 
守护 进程 对 很 多 计算 机 系统 中 具有 的 高 级 电源 管理 提供 支持 。kswapa 守 护 进程 也 称 为 页 面 调 
出 守护 进程 (pageout daemon) 。 它 通过 将 脏 页 面 以 低速 写 到 磁盘 上 从 而 使 这 些 页 面 在 需要 时 仍 
可 回收 使 用 ， 这 种 方式 支持 虚 存 子 系统 。 

Linux 内 核 使 用 两 个 守护 进程 bpGfl1ush 和 kupaated 将 高 速 缓存 中 的 数据 冲洗 到 磁盘 上 。 
当 可 用 内 存 达到 下 限时 ，bdflush 守 护 进 程 将 脏 缓 促 区 从 缓冲 池 (buffer cache) 中 冲洗 到 磁盘 
上 。 每 隔 一 定时 间 间 隔 ，kupdated 守 护 进 程 将 脏 页 面 冲 洗 到 磁盘 上 ， 以 便 在 系统 失效 时 减少 
ERB. 

端口 映射 守护 进程 Portmap 提 供 将 RPC (Remote Procedure Call, 远程 过 程 调用 ) 程序 号 映 
射 为 网 络 端口 号 的 服务 。sysloga 守 护 进程 可 由 帮助 操作 人 员 把 系统 消息 记 入 日 志 的 任何 程序 
使 用 。 可 以 在 一 台 实 际 的 控制 台 上 打印 这 些 消 息 ， 也 可 将 它们 写 到 一 个 文件 中 (13.4 节 将 对 
sys1og 设 施 进行 说 明 )。 

在 9.3 节 已 谈 到 ineta 守 护 进 程 (xinetd)。 它 侦 听 系统 网 络 接口 ， 以 便 取 得 来 自 网 络 的 
对 各 种 网 络 服务 进程 的 请 求 。nfsa、1ockd 和 rpciod 和 守护 进程 提供 对 网 络 文 件 系 统 
(Network File System, NFS) 的 支持 。 

cron 和 守护 进程 (crond) 在 指定 的 日 期 和 时 间 执 行 指定 的 命令 。 许 多 系统 管理 任务 是 由 
cron 定 期 地 执行 相关 程序 而 实现 的 。cupsa 守 护 进程 是 打印 假 脱 机 进程 ， 它 处 理 对 系统 提出 
的 所 有 打印 请 求 。 

注意 ， 大 多 数 守护 进程 都 以 超级 用 户 (用 户 ID 为 0) 特权 运行 。 没 有 一 个 守护 进程 具有 控 
制 终端 ， 其 终端 名 设置 为 问号 (?)， 终 端 前 台 进 程 组 ID 设 置 为 -1。 内 核 守护 进程 以 无 控制 终端 
方式 启动 。 用 户 层 守护 进程 缺少 控制 终端 可 能 是 守护 进程 调用 了 setsia 的 结果 。 所 有 用 户 层 
守护 进程 都 是 进程 组 的 组 长 进程 以 及 会 话 的 首 进程 ， 而 且 是 这 些 进 程 组 和 会 话 中 的 唯一 进程 。 
最 后 ， 应 当 引 起 注意 的 是 大 多 数 守护 进程 的 父 进程 是 init 进 程 。 


13.3 编程 规则 


在 编写 守护 进程 程序 时 需 遵循 一 些 基本 规则 ， 以 便 防 止 产生 并 不 需要 的 交互 作用 。 下 面 先 
说 明 这 些 规则 ， 然 后 给 出 一 个 按照 这 些 规则 编写 的 函数 daemoni ze, 
(1) 首先 要 做 的 是 调用 umask 将 文件 模式 创建 屏蔽 字 设 置 为 0。 由 继承 得 来 的 文件 模式 创建 
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屏蔽 字 可 能 会 拒绝 设置 某 些 权限 。 例 如 ， 若 守护 进程 要 创建 一 个 组 可 读 、 写 的 文件 ， 而 继承 的 
文件 模式 创建 屏蔽 字 可 能 屏蔽 了 这 两 种 权限 ， 于 是 所 要 求 的 组 可 读 、 写 就 不 能 起 作用 。 

(2) 调用 fork， 然 后 使 父 进 程 退 出 (exit)。 这 样 做 实现 了 下 面 几 点 : 第 一 ， 如 果 该 守护 
进程 是 作为 一 条 简单 shell 命 令 启动 的 ， 那 么 父 进程 终止 使 得 shell 认 为 这 条 命令 已 经 执行 完毕 ， 
第 二 ， 子 进程 继承 了 父 进程 的 进程 组 ID， 但 具有 一 个 新 的 进程 ID， 这 就 保证 了 子 进 程 不 是 一 个 
进程 组 的 组 长 进程 。 这 对 于 下 面 就 要 做 的 setsid 调 用 是 必要 的 前 提 条 件 。 

(3) 调用 setsia 以 创建 一 个 新 会 话 。 于 是 执行 9.5 节 中 列举 的 三 个 操作 ， 使 调用 进程 
(a) 成 为 新 会 话 的 首 进程 ，(b) 成 为 一 个 新 进程 组 的 组 长 进程 ，(c) 没有 控制 终端 。 


在 基于 系统 V 的 系统 中 ， 有 些 人 建议 在 此 时 再 次 调用 fork， 并 使 父 进程 终止 。 第 二 个 子 进程 作 为 
守护 进程 继续 运行 。 这 样 就 保证 了 该 守护 进程 不 是 会 话 首 进程 、 于 是 按照 系统 V 规 则 【〈 见 9.6 节 ) 可 以 
防 耻 它 取得 控制 终端 。 训 免 取 得 控制 终端 的 另 一 种 方法 是 ， 无 论 何 时 打开 一 个 终端 设备 都 一 定 要 指定 
O_NOCTTY,, 


(4) 将 当前 工作 目录 更 改 为 根 目录 。 从 父 进程 处 继承 过 来 的 当前 工作 目录 可 能 在 一 个 装配 文 
件 系统 中 。 因 为 守护 进程 通常 在 系统 再 引导 之 前 是 一 直 存 在 的 ， 所 以 如 果 守 护 进 程 的 当前 工作 
目录 在 一 个 装配 文件 系统 中 ， 那 么 该 文件 系统 就 不 能 被 拆卸 。 这 与 装配 文件 系统 的 原意 不 符 。 

另外 ， 某 些 守 护 进 程 可 能 会 把 当前 工作 目录 更 改 到 某 个 指定 位 置 ， 在 那里 做 它们 的 工作 。 
例如 ， 行 式 打印 机 假 脱 机 守护 进程 常常 将 其 工作 目录 更 改 到 它们 的 spool 目 孙 上 。 

(5) 关闭 不 再 需要 的 文件 描述 符 。 这 使 守护 进程 不 再 持 有 从 其 父 进程 继承 来 的 某 些 文件 描 
述 符 ( 父 进程 可 能 是 shell 进 程 ， 或 某 个 其 他 进程 )。 可 以 使 用 程序 清单 2-4 中 的 open_max 函 数 
HügetrlimitH&k (7.1155) 来 判定 最 高 文件 描述 符 值 ， 并 关闭 直到 该 值 的 所 有 描述 符 。 

(6) 某 些 守护 进程 打开 /aev/null 使 其 具有 文件 描述 符 0、1 和 和 2， 这样， 任何 一 个 试图 读 
标准 输入 、 写 标准 输出 或 标准 出 错 的 库 例 程 都 不 会 产生 任何 效果 。 因 为 守护 进程 并 不 与 终端 设 
备 相 关联 ， 所 以 不 能 在 终端 设备 上 显示 其 输出 ， 也 无 处 从 交互 式 用 户 那里 接收 输入 。 即 使 守护 
进程 是 从 交互 式 会 话 启动 的 ， 但 因为 守护 进程 是 在 后 台 运 行 的 ， 所 以 登录 会 话 的 终止 并 不 影响 
守护 进程 。 如 果 其 他 用 户 在 同一 终端 设备 上 登录 ,我 们 也 不 会 在 该 终端 上 见 到 守护 进程 的 输出 ， 
用 户 也 不 可 期 望 他 们 在 终端 上 的 输入 会 由 守护 进程 读 取 。 

实 例 

程序 清单 13-1 是 个 函数 ， 可 由 想 初 始 化 成 为 一 个 守护 进程 的 程序 调用 。 

程序 清单 13-1 初始 化 一 个 守护 进程 

#include "apue.h" 

#include <syslog.h> 

#include «fcntl.h» 


#include <sys/resource.h> 


void 
daemonize (const char *cmd) 


int i, £00; fal, -td2; 
pid t pid; 

struct rlimit i ag 

struct sigaction sa; 
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/* 
* Clear file creation mask. 
*/ 

umask (0) ; 


/* 
* Get maximum number of file descriptors. 
*/ 
if (getrlimit (RLIMIT_NOFILE, &rl) < 0) 
err quit("$s: can't get file limit", cmd); 


/* 
* Become a session leader to lose controlling TTY. 
*/ 
if ((pid = fork()) < 0) 
err quit("*$8: can't fork", cmd); 
else if (pid != 0) /* parent */ 
exit (0); 
setsid(); 


/* 
* Ensure future opens won't allocate controlling TTYs. 
*/ 
sa.sa handler = SIG IGN; 
Sigemptyset(&sa.sSa mask); 
8a.8a flags - 0; 
if (sigaction(SIGHUP, &sa, NULL) « 0) 
err quit("$8: can't ignore SIGHUP"); 
if ((pid = fork()) « 0) 
err quit("$s: can't fork", cmd); 
else if (pid != 0) /* parent */ 
exit(0); 


/* 
* Change the current working directory to the root so 
* we won't prevent file systems from being unmounted. 
*/ 
if (chdir("/") « 0) 
err quit("$8: can't change directory to /"); 


/* 
* Close all open file descriptors. 
* 
if (rl.rlim max == RLIM INFINITY) 
rl.rlim max = 1024; 
for (i = 0; i < rl.rlim max; i++) 
close (i); 


/* 
* Attach file descriptors 0, 1, and 2 to /dev/null. 
*/ 


fd0 = open("/dev/nul1l", O_RDWR) ; 
fdl - dup(0); 
fd2 = dup(0); 

/* 

* Initialize the log file. 

*/ 


openlog(cmd, LOG CONS, LOG DAEMON); 
if (fdo !- 0 || fdi i= 1 || fa2 != 2) { 
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syslog(LOG_ERR, "unexpected file descriptors %d %d %d", 
£d0, fdl, fd2); 
exit (1); 


) 





若 daemonize 函 数 由 main 程 序 调用 ， 然 后 main 程 序 进入 休 卢 状态， 那么 可 以 用 ps 命令 
检查 该 守护 进程 的 状态 : 


$ ./a.out 
$ ps -axj 
PPID PID PGID SID TTY TPGID UID COMMAND 
1 3346 3345 3345 ? -1 501 ./a.out 
$ ps -axj | grap 3345 
1 3346 3345 3345 ? -1 501 ./a.out 


也 可 用 ps 命令 验证 ， 没 有 一 个 活动 进程 的 ID 是 3345。 这 意味 着 ， 我 们 的 守护 进程 在 一 个 孤儿 进程 组 
中 (9.10 节 )， 它 不 是 一 个 会 话 首 进程 ， 于 是 不 会 有 机 会 分 配 到 一 个 控制 终端 。 这 是 在 aaemonize 
函数 中 执行 第 二 个 fork 造 成 的 。 由 此 可 以 见 到 ， 此 守护 进程 已 经 被 正确 地 初始 化 了 。 口 


13.4 ”出 错 记 录 


与 守护 进程 有 关 的 一 个 问题 是 如 何 处 理 出 错 消 息 。 因 为 它 没有 控制 终端 ， 所 以 不 能 只 是 简 
单 地 写 到 标准 出 错 上 。 在 很 多 工作 站 上 ， 控 制 台 设 备 运行 一 个 窗口 系统 ， 所 以 我 们 不 希望 所 有 
守护 进程 都 写 到 控制 台 设 备 上 。 我 们 也 不 希望 每 个 守护 进程 将 它 自己 的 出 错 消息 写 到 一 个 单独 
的 文件 中 。 对 系统 管理 人 员 而 言 ， 如 果 要 关心 哪 一 个 守护 进程 写 到 哪 一 个 记录 文件 中 ， 并 定期 
地 检查 这 些 文件 ， 那 么 一 定 会 使 他 感到 头痛 。 所 以 ， 需 要 有 一 个 集中 的 守护 进程 出 错 记录 设施 。 


在 伯克利 开发 了 BSD syslog 设 施 ， 并 广泛 应 用 于 4.2BSD 。 从 BSD 派 生 的 很 多 系统 都 支持 
syslog, 

在 SVR4 之 前 ， 系 统 V 中 从 来 没有 一 个 集中 的 守护 进程 记录 设施 。 

在 Single UNIX Specification 的 XSI 扩 展 中 包括 了 syslog 函 数 。 


自 4.2BSD 以 来 ，BSD syslog 设 施 得 到 了 广泛 应 用 。 大 多 数 守 护 进 程 使 用 这 一 设施 。 图 
13-1 显 示 了 syslog 设 施 的 详细 组 织 结构 。 


写 到 文件 或 日 记 用 户 进 程 ， 或 者 发 送 给 其 他 主机 


syslog 






UNIX 域 数据 报 套 接 字 因特网 域 数据 报 套 接 字 


1 
1 
1 
1 
1 
1 
1 
1 
1 


图 13-1 BSD syslog 设 施 
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有 三 种 方法 产生 日 志 消 息 : 

(1) 内 核 例 程 可 以 调用 log 函 数 。 任 何 一 个 用 户 进程 通过 打开 (open) 然后 读 (read) 
/dev/klog 设 备 就 可 以 读 取 这 些 消息 。 因 为 我 们 无 意 编写 内 核 例 程 ， 所 以 不 再 进一步 说 明 此 
EL 

(2) 大 多 数 用 户 进程 〈 守 护 进程 ) WRIsvslogQ)EEELUT HE BEER. RRE P TEE UU 
其 调用 序列 。 这 使 消息 发 送 至 UNIX 域 数据 报 套 接 字 /dev/1og。 

(3) 在 此 主机 上 的 一 个 用 户 进程 ， 或 通过 TCP/IP 网 络 连 接 到 此 主机 的 其 他 主机 上 的 一 个 用 
户 进程 可 将 日 志 消 息 发 向 UDP 端 日 514。 注 意 ，syslog 函 数 并 不 产生 这 些 UDP 数 据 报 ， 而 是 要 
求 产生 此 日 志 消 息 的 进程 进行 显 式 的 网 络 编程 。 

关于 UNIX 域 套 接 字 以 及 UDP 套 接 字 的 细节 ， 请 参阅 Stevens, Fenner, and Rudoff [2004], 

通常 ，syslogg 和 守护 进程 读 取 三 种 格式 的 日 志 消 息 。 此 守护 进程 在 启动 时 读 一 个 配置 文件 ， 
一 般 其 文件 名 为 /etc/syslog .conf， 该 文件 决定 了 不 同 种 类 的 消息 应 送 向 何 处 。 例 如 ， 紧 急 
消息 可 被 送 向 系统 管理 员 〈 若 已 登录 ) ， 并 在 控制 台 上 显示 ， 而 警告 消息 则 可 记录 到 一 个 文件 中 。 

该 设施 的 接口 是 syslog 函 数 。 


#include <syslog.h> 


void openlog(const char *ident, int option, int facility) ; 


void syslog(int priority, const char *format, ...); 
void closelog (void) ; 
int setlogmask(int maskpri) ; 


返回 值 : 前 日 志 记录 优先 级 屏蔽 什 


调用 openlog 是 可 选择 的 。 如 果 不 调用 openlog， 则 在 第 一 次 调用 syslog 时 ， 自 动 调用 
openlog。 调 用 closelog 也 是 可 选 树 的 一 一 它 只 是 关闭 曾 被 用 于 与 sys1ogd 和 守护 进程 通信 和 的 

调用 openlog 使 我 们 可 以 指定 一 个 ident， 将 它 加 至 每 则 日 志 消 息 中 。ident 一 般 是 程序 的 名 
称 ( 例 如 ，cron、inetgd 等 )。option 参 数 是 指定 许多 选项 的 位 屏 项。 表 13-1 说 明了 可 用 的 
option (选项 ) 。 若 某 选 项 在 Single UNIX Specification 的 openlog 定 义 中 已 包括 ， 则 其 XSI 列 用 
一 个 黑 点 表示 。 





表 13-1 openlog 的 option 参 数 


LOG_CONS 昔日 志 消息 不 能 通过 UNIX 域 数据 报 送 至 syslogd， 则 将 该 消息 写 至 控制 台 

LOG_NDELAY 立即 打开 至 sys1logd 守 护 进程 的 UNIX 域 数据 报 套 接 字 ， 不 要 等 到 记录 了 第 一 条 消息 。 通 
常 ， 在 记录 第 一 条 消息 之 前 ， 不 打开 该 套 接 字 

LOG_NOWAIT 不 等 待 在 将 消息 记 入 日 志 过 程 中 可 能 已 创建 的 子 进程 。 因 为 在 syslog 调 用 wait 时 ， 应 用 


程序 可 能 已 获得 子 进程 的 状态 ， 这 种 处 理 阻 止 了 与 捕捉 SIGCHLD 信 号 的 应 用 程序 的 冲突 
LOG_ODELAY 在 记录 第 一 条 消息 之 前 延迟 打开 至 syslogd 守 护 进 程 的 连接 
LOG_PERROR 除 将 日 志 消 息 发 送 给 sysloga 外 ， 还 将 它 写 至 标准 出 错 〈 在 Solaris 上 不 可 用 ) 
LOG_PID 每 条 消息 都 包含 进程 ID。 此 选项 可 供 对 每 个 请 求 都 调用 fork 产 生 一 个 子 进程 的 守护 进程 使 
用 (与 从 不 调用 fork 的 守护 进程 比如 syslogaG 对 比 》 
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openlog 的 参数 facility 可 以 选取 表 13-2 中 列举 的 值 。 注 意 ，Single UNIX Specification 只 定 
义 了 facility 参 数值 的 一 个 子 集 ， 该 子 集 是 在 一 个 给 定 的 平台 上 典型 地 可 用 的 。 设 置 facility( 设 
施 ) 参数 的 目的 是 可 以 让 配置 文件 说 明 ， 来 自 不 同 设施 的 消息 将 以 不 同 的 方式 进行 处 理 。 如 果 
不 调用 openlog， 或 者 以 facility 为 0 来 调用 它 ， 那 么 在 调用 syslog 时 ， 可 将 设施 作为 priority 参 数 
的 一 个 部 分 进行 说 明 。 


表 13-2 openlog 的 faciliy 参 数 


LOG_AUTH PERE: login, su, getty 
LOG_AUTHPRIV 与 .OG_AUTH 相 同 , 但 写 日 志文 件 时 具有 权限 限制 
LOG_CRON cron 和 at 

LOG_DAEMON ASAPH, inetd, routed 

LOG_FTP FTP 守护 进程 (ftpd) 























































































LOG_KERN 内 核 产生 的 消息 
LOG_LOCALO 保留 由 本 地 使 用 
LOG_LOCAL1 保留 由 本 地 使 用 
LOG_LOCAL2 保留 由 本 地 使 用 
LOG_LOCAL3 保留 由 本 地 使 用 
LOG_LOCAL4 保留 由 本 地 使 用 

LOG, LOCAL5 保留 由 本 地 使 用 
LOG_LOCAL6 保留 由 本 地 使 用 
LOG_LOCAL7 保留 由 本 地 使 用 

LOG_LPR THERA: 1pd, lpc# 
LOG, MAIL 邮件 系统 

LOG_NEWS Usenet 网 络 新 闻 系 统 
LOG_SYSLOG sys1ogd 守 护 进程 本 身 
LOG_USER 来 自 其 他 用 户 进 程 的 消息 (默认 ) 
LOG, UUCP UUCP A £ft 


调用 syslog 产 生 一 个 日 志 消 息 。 其 priority 参 数 是 facility 和 level 的 组 合 ， 它 们 可 选取 的 值 
分 别 列 于 表 13-2 和 表 13-3 中 。level 值 按 优先 级 从 最 高 到 最 低 按 序 排列 。 


表 13-3 ”syslog 中 的 level ( 按 序 排列 ) 


LOG_EMERG 紧急 状态 (系统 不 可 使 用 ) (最 高 优先 级 ) 
LOG_ALERT 必须 立即 修复 的 状态 
LOG_CRIT 严重 状态 (例如 ， 硬 设备 出 错 ) 


LOG_ERR 出 错 状态 
LOG_WARNING 警告 状态 

LOG_NOTICE 正常 ， 但 重要 的 状态 
LOG_INFO 信息 性 消息 
LOG_DEBUG 调试 消息 (最低 优先 级 ) 


format 参 数 以 及 其 他 参数 传 至 vsprintf 函 数 以 便 进行 格式 化 。 在 format 中 ， 每 个 sm 都 先 
被 代 换 成 对 应 于 errno 值 的 出 错 消息 字符 串 (strerror)。 
setlogmask 函 数 用 于 设置 进程 的 记录 优先 级 屏蔽 字 。 它 返回 调用 它 之 前 的 屏蔽 字 。 当 设 
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置 了 记录 优先 级 屏蔽 字 时 ， 除 非 消息 的 优先 级 已 在 记录 优先 级 屏蔽 字 中 设置 ， 否 则 消息 不 被 记 
录 。 注 意 ， 试 图 将 该 屏蔽 字 设 置 为 0 并 不 产生 任何 作用 。 

很 多 系统 也 提供 1ogger(1) 程 序 ， 以 其 作为 向 sys1og 设 施 发 送 日 志 消 息 的 方法 。 虽 然 
Single UNIX Specification 并 未 定义 任何 可 选 参数 ， 但 某 些 实现 还 是 允许 该 程序 的 可 选 参数 指定 
facilityy、level 以 及 ident。1logger 命 令 本 是 为 了 用 于 以 非 交 互 方式 运行 但 又 要 产生 日 志 消 息 的 
shell 脚 本 的 。 


在 一 个 (假定 的 ) 行 式 打印 机 假 脱 机 守护 进程 中 ， 可 能 包含 有 下 面 的 调用 序列 : 


openlog ("lpd", LOG PID, LOG LPR); 
SySlog(LOG ERR, "open error for $s: $m", filename); 


第 一 个 调用 将 iden! 字 符 串 设置 为 程序 名 ， 指 定 打印 该 进程 ID， 并 且 将 系统 默认 的 facility 设 定 为 
行 式 打印 机 系统 。 对 syslog 的 调用 指定 一 个 出 错 状态 和 一 个 消息 字符 串 。 如 若 不 调用 
openlog， 则 第 二 个 调用 的 形式 可 能 是 : 
syslog(LOG_ERR | LOG LPR, "open error for $s: $m", filename); 
其 中 ， 将 prioripy 参 数 指定 为 levelf 和 jacility 的 组 合 。 口 
除了 syslog， 很 多 平台 还 提供 它 的 一 种 变 体 处 理 可 变 参数 列表 。 


#include <syslog.h> 
#include <stdarg.h> 


void vsyslog(int priority, const char *format, va_list arg); 





本 书 说 明 的 所 有 四 种 平台 都 提供 vsyslog， 但 Single UNIX Specification 并 不 包括 它 。 


大 多 数 syslog 实 现 将 使 消息 短 时 间 处 于 队列 中 。 如 果 在 此 段 时 间 中 到 达 了 重复 消息 ， 那 
么 syslog 守 护 进程 将 不 把 它 写 到 日 记 记 录 中 ， 而 是 打印 输出 一 条 消息 ， 类 似 于 “上 一 条 消息 
重复 了 N 次 ”。 


19.5 单 实 例 守护 进程 


为 了 正常 运作 ， 某 些 守护 进程 实现 为 单 实例 的 ， 也 就 是 在 任 一 时 刻 只 运行 该 守护 进程 的 一 
个 副本 。 例 如 ， 该 守护 进程 可 能 需要 排 它 地 访问 一 个 设备 。 在 czon 守 护 进程 情况 下 ， 如 果 同 
时 有 多 个 实例 运行 ， 那 么 每 个 副本 都 可 能 试图 开始 某 个 预定 的 操作 ， 于 是 造成 该 操作 的 重复 执 
行 ， 这 很 可 能 导致 出 错 。 

如 果 守 护 进程 需要 访问 一 设备 ， 而 该 设备 驱动 程序 将 阻止 多 次 打开 在 /dev 目 录 下 的 相应 
设备 节点 ， 那 么 这 就 达到 了 任何 时 刻 只 运行 守护 进程 一 个 副本 的 要 求 。 但 是 如 果 没 有 这 种 设备 
可 供 使 用 ， 那 么 我 们 就 需要 自行 处 理 。 

文件 锁 和 记录 锁 机 制 是 一 种 方法 的 基础 ， 该 方法 用 来 保证 一 个 守护 进程 只 有 一 个 副本 在 运 
行 。( 在 14.3 节 中 再 来 讨论 文件 和 记录 锁 .) 如 果 每 一 个 守护 进程 创建 一 个 文件 ， 并 且 在 整个 文 
件 上 加 上 一 把 写 锁 ， 那 就 只 允许 创建 一 把 这 样 的 写 锁 ， 所 以 在 此 之 后 如 试图 再 创建 一 把 这 样 的 
写 锁 就 将 失败 ， 以 此 向 后 续 守 护 进程 副本 指明 已 有 一 个 副本 正在 运行 。 
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文件 和 记录 锁 提 供 了 一 种 方便 的 互 扩 机制。 如 果 守 护 进程 在 整个 文件 上 得 到 一 把 写 锁 ， 那 
么 在 该 守护 进程 终止 时 ， 这 把 锁 将 被 自动 删除 。 这 就 简化 了 复原 所 需 的 处 理 ， 去 除了 对 以 前 的 
守护 进程 实例 需要 进行 清理 的 有 关 操 作 。 








程序 清单 13-2 中 的 函数 说 明了 如 何 使 用 文件 和 记录 锁 以 保证 只 运行 某 守护 进程 的 一 个 副本 。 
程序 清单 13-2 保证 只 运行 某 个 守护 进程 的 一 个 副本 


#include <unistd.h> 
#include <stdlib.h> 
#include «fcntl.h» 
#include <syslog.h> 
#include <string.h> 
#include <errno.h> 
#include <stdio.h> 
#include «sys/stat.h» 


#define LOCKFILE "/var/run/daemon.pid" 
#define LOCKMODE (S IRUSR|S IWUSR|S IRGRP|S IROTH) 


extern int lockfile(int); 
int 
already running (void) 


{ 
int fd; 
char buf [16] ; 


fd = open(LOCKFILE, O RDWR|O CREAT, LOCKMODE) ; 

if (fd < 0) { 
syslog(LOG ERR, "can't open %s: %s", LOCKFILE, strerror(errno)); 
exit(1); 


} 
if (lockfile(fd) < 0) { 
if (errno == EACCES || errno == EAGAIN) { 
close (fd); 
return (1); 


syslog(LOG_ERR, "can't lock $s: $s", LOCKFILE, strerror(errno)); 
exit (1); 


ftruncate(fd, 0); 

sprintf (buf, "*1d", (long)getpid()); 
write(fd, buf, strlen(buf)+1); 
return(0); 


) 


守护 进程 的 每 个 副本 都 将 试图 创建 一 个 文件 ， 并 将 其 进程 ID 写 到 该 文件 中 。 这 使 管理 人 员 
易于 标识 该 进程 。 如 果 该 文件 已 经 加 了 锁 ， 那 么 1ockfi1le 函 数 将 失败 ，errno 设 置 为 
EACCES 或 EAGAIN， 函 数 返 回 1!， 这 表明 该 守护 进程 已 在 运行 。 否 则 将 文件 长 度 截 短 为 0， 将 进 
程 ID 写 入 该 文件 ， 函 数 返 回 0。 

我 们 需要 将 文件 长 度 截 短 为 0， 其 原因 是 以 前 守护 进程 实例 的 进程 ID 字符 串 可 能 长 于 调用 
此 函数 的 当前 进程 的 进程 ID 字符 串 。 例 如 ， 若 以 前 的 守护 进程 的 进程 也是 12345， 而 新 实例 的 
进程 ID 是 9999， 那 么 将 此 进程 ID 写 入 文件 后 ， 在 文件 中 留 下 的 是 99995。 将 文件 长 度 截 短 为 0 就 
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解决 了 此 问题 。 口 


13.6 守护 进程 的 惯例 


在 UN 系统 中 ， 和 守护 进程 遵循 下 列 公 共 惯 例 ， 
“ 若 守护 进程 使 用 锁 文 件 ， 那 么 该 文件 通常 存放 在 /var/run 目 录 中 。 注 意 ， 守 护 进程 可 
能 需 具 有 超级 用 户 权限 才能 在 此 目录 下 创建 文件 。 锁 文件 的 名 字 通 常 是 name.pid， 其 中 ， 
name 是 该 守护 进程 或 服务 的 名 字 。 例 如 ，cron 守 护 进程 锁 文 件 的 名 字 是 /var/run/ 
crond.pid, 

“ 若 守护 进程 支持 配置 选项 ， 那 么 配置 文件 通常 存放 在 /etc 目 录 中 。 配 置 文件 的 名 字 通 常 
是 name.conf， 其 中 ，name 是 该 守护 进程 或 服务 的 名 字 。 例 如 ，sys1ogd 和 守护 进程 的 配 
置 文件 是 /etc/syslog.conf。 

“守护 进程 可 用 命令 行 启 动 ， 但 通常 它们 是 由 系统 初始 化 脚本 之 一 (/etc/rc* 
/etc/init.d/*) 启动 的 。 如 果 在 守护 进程 终止 时 ， 应 当 自动 地 重新 启动 它 ， 则 我 们 
可 在 /etc/inittab 中 为 该 守护 进程 包括 _respawn 记 录 项 ， 这 样 ，init 就 将 重启 动 该 
守护 进程 。 

* 若 一 守护 进程 有 一 配置 文件 ， 那 么 当 该 守护 进程 启动 时 ， 它 读 该 文件 ， 但 在 此 之 后 一 般 
就 不 会 再 查看 它 。 若 一 管理 员 更 改 了 配置 文件 ， 那 么 该 守护 进程 可 能 需要 被 停止 ， 然 后 
再 启动 ， 以 使 配置 文件 的 更 改 生效 。 为 避免 此 种 麻烦 ， 某 些 守 护 进程 将 捕 提 SIGHUP 信 号 ， 
当 它 们 接收 到 该 信号 时 ， 重 读 配置 文件 。 因 为 守护 进程 并 不 与 终端 相 结 合 ， 它 们 或 者 是 
无 控制 终端 的 会 话 首 进程 ， 或 者 是 孤儿 进程 组 的 成 员 ， 所 以 守护 进程 并 不 期 望 接收 

SIGHUP。 于 是 ， 它 们 可 以 安全 地 重复 使 用 它 。 






程序 清单 13-3 所 示 程 序 说 明了 守护 进程 可 以 重读 其 配置 文件 的 一 种 方法 。 该 程序 使 用 
sigwait 以 及 多 线程 ， 对 此 我 们 已 经 在 12.8 节 讨论 过 ，。 
程序 清单 13-3 守护 进程 重读 配置 文件 
#include "apue .hn 
#include <pthread.h> 
#include <syslog.h> 
sigset_t mask; 
extern int already running(void); 


void 
reread (void) 


f Sse M 
) 


void * 
thr fn(void *arg) 


int err, signo; 
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for (;;) { 
err = Sigwait(&mask, &signo) ; 
if (err != 0) { 
SySlog(LOG ERR, "sigwait failed"); 
exit (1); 


) 


switch (signo) { 

case SIGHUP: 
Syslog(LOG INFO, "Re-reading configuration file"); 
reread(); 
break; 


case SIGTERM: 
SySlog(LOG INFO, "got SIGTERM; exiting"); 
exit (0); 


default: 
Syslog(LOG INFO, "unexpected signal %d\n", signo); 


) 


return(0); 


) 


int 
main(int argc, char *argví]) 


{ 


int err; 
pthread t tid; 
char *omd; 
struct sigaction sa; 


if ((cmd = strrchr(argv[0], '/')) == NULL) 
cmd = argví0]; 

else 
cmd++; 


/* 
* Become a daemon. 
*/ 


daemonize (cmd) ; 


/* 
* Make sure only one copy of the daemon is running. 
*/ 
if (already running()) { 
8yslog(LOG ERR, "daemon already running"); 


exit (1); 
} 
/* 
* Restore SIGHUP default and block all signals. 
*/ 


sa.sa handler = SIG DFL; 

sigemptyset(&sa.sa mask); 

sa.sa flags = 0; 

if (sigaction(SIGHUP, &sa, NULL) « 0) 
err quit("$s: can't restore SIGHUP default"); 

sigfillset (&mask) ; 

if ((err = pthread sigmask(SIG BLOCK, &mask, NULL)) != 0) 
err_exit(err, "SIG_ BLOCK error"); 
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/* 
* Create a thread to handle SIGHUP and SIGTERM. 
x 
err = pthread create(&tid, NULL, thr fn, 0); 
if (err !s 0) 
err_exit(err, "can't create thread"); 


/* 
* Proceed with the rest of the daemon. 
*/ 

J* oaa 8f 

exit (0); 


} 


该 程序 调用 程序 清单 13-1 中 的 aaemonize 以 初始 化 守护 进程 。 从 该 函数 返回 后 ， 调 用 程序 
清单 13-2 中 的 already_running 函 数 以 确保 该 守护 进程 只 有 一 个 副本 在 运行 。 到 达 这 一 点 时 ， 
SIGHUP 信 号 仍 被 忽略 ， 所 以 需 恢复 对 该 信号 的 系统 默认 处 理 方式 ， 否 则 调用 sigwait 的 线程 
决 不 会 见 到 该 信号 。 

如 同 对 多 线程 程序 所 推荐 的 那样 ， 我 们 阻塞 所 有 信和 号， 然后 创建 一 线程 ， 由 它 来 处 理 信号 。 
该 线程 的 唯一 工作 是 等 待 SIGHUP 和 SIGTERM。 当 接收 到 SIGHUP 信 号 时 ， 该 线程 调用 reread 
A Bik EAA RICH, 当 它 接收 到 SIGTERM 信 号 时 ， 记 录 一 消息 ， 然 后 终止 。 

回忆 表 10-1， 对 于 SIGHUP 和 SIGTERM 的 默认 动作 是 终止 进程 。 因 为 我 们 阻塞 了 这 些 信号 ， 
所 以 当 对 进程 产生 这 些 信号 时 ， 守 护 进 程 不 会 消亡 ， 而 是 调用 sigwait 的 线程 在 返回 时 将 指示 
已 接收 到 该 信号 。 口 











如 在 12.8 节 所 说 明 的 那样 ，Linux 线 程 对 于 信号 的 处 理 方式 与 众 不 同 。 由 于 这 一 点 ， 在 程序 
清单 13-3 中 对 信号 标识 合适 的 进程 是 困难 的 。 另 外 ， 由 于 实现 的 差别 ， 不 能 保证 守护 进程 将 按 
所 期 望 的 那样 做 出 反应 。 
程序 清单 13-4 说 明 守 护 进程 无 需 使 用 多 线程 也 可 以 捕捉 STGHUP 并 重读 其 配置 文件 。 


程序 清单 13-4 守护 进程 重读 配置 文件 的 另 一 种 实现 


#tinclude "apue.h" 
#include <syslog.h> 
#include <errno.h> 


extern int lockfile(int) ; 
extern int already running (void); 


void 


reread(void) 


f* ais 
) 


void 
Sigterm(int signo) 


Syslog (LOG INFO, "got SIGTERM; exiting"); 
exit(0); 


 bbs.theithome.com 





13.6 守护 进程 的 惯例 353 


void 
sighup(int signo) 


syslog(LOG_INFO, "Re-reading configuration file"); 


reread (); 
} 437 


int 
main(int argc, char *argv[]) 


{ 
char *omd; 
struct sigaction 8a; 


if ((emd = strrchr(argv[0], '/')) == NULL) 
cmd = argv[0]; 

else 
cmd++; 


/* 
* Become a daemon. 
*/ 
daemonize (cmd) ; 
/* 
* Make sure only one copy of the daemon is running. 
*/ 
if (already running ()) { 
Syslog(LOG ERR, "daemon already running"); 


exit(1); 
) 
/* 
* Handle signals of interest. 
*/ 


sa.sa_ handler = sigterm; 

sigemptyset(&sa.sa mask); 

sigaddset(&sa.sa mask, SIGHUP); 

Sa.Sa flags = 0; 

if (sigaction(SIGTERM, &sa, NULL) « 0) { 
Syslog(LOG ERR, "can't catch SIGTERM: $8", strerror(errno)); 
exit(1); 

) 

sa.sa handler = sighup; 

Sigemptyset(&sa.sa mask); 

sigaddset(&sa.sa mask, SIGTERM) ; 

sa.sa flags = 0; 

if (sigaction(SIGHUP, &sa, NULL) « 0) { 
Syslog(LOG ERR, "can't catch SIGHUP: $5", strerror(errno)); 
exit (1); 


} 
/* 
* Proceed with the rest of the daemon. 
* 
on */ 
exit(0); 
} 438 


在 初始 化 守护 进程 后 ， 我 们 为 SITGHUP 和 sIGTERM 配 置信 号 处 理 程序 。 我 们 可 以 将 重读 罗 
辑 放 在 信号 处 理 程序 中 ， 也 可 以 只 在 其 中 设置 一 个 标志 ， 由 守护 进程 的 主线 程 做 所 有 所 需 的 
工作 。 = 
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13.7 客户 进程 -服务 器 进程 模型 


守护 进程 常常 用 作 服务 器 进程 。 确 实 ， 我 们 可 以 称 图 13-1 中 的 sys1logq 进 程 为 服务 器 进程 ， 
用 户 进程 (客户 进程 ) 用 UNIX 域 数据 报 套 接 字 向 其 发 送 消息 。 

一 般 而 言 ， 服 务 器 是 等 待 客户 进程 与 其 联系 的 一 个 进程 ， 客 户 进程 向 它 提 出 某 种 类 型 的 服 
务 要 求 。 图 13-1 中 ， 由 sys1logd 服 务 器 进程 提供 的 服务 是 将 出 错 消息 记录 到 日 志文 件 中 。 

图 13-1 中 ， 客 户 进程 和 服务 器 进程 之 间 的 通信 是 单 向 的 。 客 户 进程 向 服务 器 进程 发 送 服务 
请 求 ， 服 务 器 进程 则 不 向 客户 进程 回 送 任何 消息 。 在 接 下 来 有 关 进 程 通 信 的 几 章 中 ， 我 们 将 见 
到 大 量 客户 进程 和 服务 器 进程 之 间 双 向 通信 的 实例 。 客 户 进程 向 服务 器 进程 发 送 请 求 ， 服 务 器 
进程 则 向 客户 进程 回 送 应 答 。 


13.8 小 结 


在 大 多 数 UNIX 系 统 中 ， 守 护 进程 是 一 直 运行 的 。 为 了 初始 化 我 们 自己 的 守护 进程 ， 需 要 
审慎 思索 并 深入 理解 第 9 章 中 说 明 过 的 进程 之 间 的 关系 。 本 章 开发 了 一 个 可 由 守护 进程 调用 的 、 
对 其 自身 正确 地 进行 初始 化 的 函数 。 

因为 守护 进程 通常 没有 控制 终端 ， 所 以 本 章 还 讨论 了 守护 进程 记录 出 错 消 息 的 几 种 方法 。 
我 们 讨论 了 在 大 多 数 UNIX 系 统 中 ， 守 护 进程 遵循 的 若干 惯例 ， 给 出 了 几 个 如 何 实现 某 些 惯例 
的 实例 。 


习题 

13.1 从 图 13-1 可 以 看 出 ， 直 接 调 用 open1og 或 第 一 次 调用 syslog 都 可 以 初始 化 sys1log 设 施 ， 
此 时 一 定 要 打开 用 于 UNIX 域 的 数据 报 套 接 字 的 特殊 设备 文件 /aev/1og。 如 果 调 用 
open1log 前 ， 用 户 进程 (守护 进程 ) 先 调用 了 chroot， 结 果 如 何 ? 

13.2 列 出 你 的 系统 中 所 有 活动 的 守护 进程 ， 并 说 明 它 们 的 功能 。 

13.3 编写 一 段 调用 程序 清单 13-1 中 daemonize 函 数 的 程序 。 调 用 该 函数 后 再 调用 get1ogin 


( 见 8.15 节 ) 查看 该 进程 是 否 有 登录 名 (既然 它 现在 已 成 为 守护 进程 )。 将 结果 打印 到 一 个 
文件 中 。 


_bbs.theithome.com 


第 14 章 
高 级 UO 


14.1 引言 


本 章 内 容 包括 非 阻塞 IO、 记 录 锁 、 系 统 V 流 机 制 、LO 多 路 转 接 (select 和 pol1l 函 数 )、 
readv 和 writev 函 数 以 及 存储 映射 YO (mmap)， 这 些 都 称 为 高 级 WO。 第 15 章 、 第 17 章 中 的 进 
程 间 通信 ， 以 及 以 后 各 章 中 的 很 多 实例 都 要 使 用 本 章 所 描述 的 概念 和 函数 。 


14.2 JEBAZEI/O 


10.5 节 中 曾 将 系统 调用 分 成 “低速 ”系统 调用 和 其 他 系统 调用 两 类 。 低 速 系统 调用 是 可 能 
会 使 进程 永远 阻塞 的 一 类 系统 调用 ， 它 们 包括 下 列 调用 ， 

。 如 果 某 些 文件 类 型 (例如 管道 、 终 端 设备 和 网 络 设备 ) 的 数据 并 不 存在 ， 则 读 操作 可 能 

会 使 调用 者 永远 阻塞 。 

。 如 果 数 据 不 能 立即 被 上 述 同样 类 型 的 文件 接受 (由 于 在 管道 中 无 空间 、 网 络 流 控制 等 )， 

则 写 操 作 也 会 使 调用 者 永远 阻塞 。 

。 在 某 种 条 件 发 生 之 前 ， 打 开 某 些 类 型 的 文件 会 被 阻塞 (例如 打开 一 个 终端 设备 可 能 需 等 

到 与 之 连接 的 调制 解 调 器 应 答 ， 又 例如 在 没有 其 他 进程 已 用 读 模 式 打 开 该 FIFO 时 若 以 只 

写 模式 打开 FIFO， 那 么 也 要 等 待 )。 

。 对 已 经 加 上 强制 性 记录 锁 的 文件 进行 读 、 写 。 

。 某 些 ioct1 操 作 。 

。 某 些 进程 间 通 信子 数 ( 见 第 15 章 )。 

我 们 也 曾 说 过 ， 虽 然 读 、 写 磁盘 文件 会 使 调用 者 在 短暂 时 间 内 阻塞 ， 但 并 不 能 将 与 磁盘 IO 
有 关 的 系统 调用 视 为 “低速 "。 

非 阻塞 IO 使 我 们 可 以 调用 open、readq 和 write 这 样 的 IO 操作 ， 并 使 这 些 操作 不 会 永远 
阻塞 。 如 果 这 种 操作 不 能 完成 ， 则 调用 立即 出 错 返 回 ， 表 示 该 操作 如 继续 执行 将 阻塞 。 

对 于 一 个 给 定 的 描述 符 有 两 种 方法 对 其 指定 非 阻塞 IO : 

(1) 如 果 调 用 open 获 得 描述 符 ， 则 可 指定 O_NONBLOCK 标 志 (413.3549). 

(2) 对 于 已 经 打开 的 一 个 描述 符 ， 则 可 调用 fcnt1， 由 该 函数 打开 O_NONBLOCK 文 件 状态 
标志 ( 见 3.14 节 )。 程 序 清单 3-5 中 的 函数 可 用 来 为 一 个 描述 符 打开 任 一 文件 状态 标志 。 

系统 V 的 早期 版 本 使 用 标志 0O_NDELAY 指 定 非 阻 塞 方式 。 在 这 些 版 本 中 ， 如 果 无 数据 可 读 ， 则 read 
返回 值 0。 而 UNIX 系 统 又 常 将 read 的 返回 值 0 解释 为 文件 结束 ， 两 者 有 所 混 清 。 因 此 POSIX.1 提 供 了 一 
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个 名 字 和 语义 都 与 O_NDELAY 不 同 的 非 阻塞 标志 。 确 实 ， 在 系统 V 的 早期 版 本 中 ， 当 从 read 得 到 返回 值 
0 时 ， 我 们 并 不 知道 该 调用 是 否 阻塞 了 或 已 到 文件 结尾 处 。POSIX.1 要 求 ， 对 于 一 个 非 阻 塞 的 描述 得 如 
果 无 数据 可 读 ， 则 readQ 返 回 -1， 并 且 errno 被 设置 为 EAGRTN。 系 统 V 派 生 的 某 些 平台 支持 较 老 的 
O_NDELAY 和 POSIX.1 的 O_NONBLOCK 两 者 ， 但 在 本 书 的 实例 中 只 使 用 POSIX.1 的 规定 。O_NDELAY 只 是 
为 了 向 后 兼容 ， 不 应 在 新 应 用 程序 中 使 用 。 


4.3BSD 为 fcnt1 提 供 了 FNDELAY 标 志 ， 其 语义 也 稍 有 区 别 。 它 不 只 影响 描述 符 的 文件 状态 标志 ， 
还 将 终端 设备 或 套 接 字 的 标志 更 改 成 非 阻塞 的 ， 因 此 不 仅 影响 共享 同一 文件 表 项 的 用 户 ， 而 且 对 终端 
或 套 接 字 的 所 有 用 户 起 作用 (4.3BSD 非 阻塞 UO 只 对 终端 和 和 套 接 字 起 作用 ) 。 另 外 ， 如 果 对 一 个 非 阻塞 
描述 待 的 操作 不 能 无 阻 富 地 完成 ， 那 么 4.3BSD 返 回 EWOULDBLOCK。 现 今 ， 基 于 BSD 的 系统 提供 
POSIX.1 的 O_NONBLOCK 标 志 ， 并 且 将 EWOULDBLOCK 定 义 为 与 POSIX.1 的 EAGAIN 相 同 。 这 些 系 统 提 供与 
其 他 依从 POSIX 系 统 相 一 致 的 非 阻 塞 语义 。 文 件 状态 标志 的 更 改 影响 同一 文件 表 项 的 所 有 用 户 ， 全 与 
通过 其 他 文件 表 项 对 同一 设备 的 访问 无 关 (参见 图 3-1 和 图 3-3) 


程序 清单 14-1 是 一 个 非 阻 塞 IO 的 实例 ， 它 从 标准 输入 读 500 000 字 节 ， 并 试图 将 它们 号 到 
标准 输出 上 。 该 程序 先 将 标准 输出 设置 为 非 阻塞 的 ， 然 后 用 fo 循环 进行 输出 ， 每 次 write 调 
用 的 结果 都 在 标准 出 错 上 打印 。 函 数 clr-f1 类 似 于 程序 清单 3-5 中 的 set_f1, 但 与 set_f1 的 
442| ”功能 相反 ， 它 清除 1 个 或 多 个 标志 位 。 


程序 清单 14-1 长 的 非 阻塞 write 


#include "apue.h" 
#include <errno.h> 
#include «fcntl.h» 


char buf [500000] ; 


int 
main (void) 


int ntowrite, nwrite; 
char *ptr; 


ntowrite = read(STDIN FILENO, buf, sizeof (buf)); 
fprintf(stderr, "read $d bytes\n", ntowrite); 


set_f1(STDOUT_FILENO, O NONBLOCK); /* set nonblocking */ 


ptr = buf; 

while (ntowrite > 0) { 
errno = 0; 
nwrite = write(STDOUT_FILENO, ptr, ntowrite) ; 
fprintf(stderr, "nwrite = td, errno = $dWMn", nwrite, errno); 


if (nwrite > 0) { 


ptr += nwrite; 
ntowrite -= nwrite; 
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clr fl(STDOUT FILENO, O NONBLOCK); /* clear nonblocking */ 


exit(0); 


若 标 准 输出 是 普通 文件 ， 则 可 以 期 望 write 只 执行 一 次 : 


$ 1s -1 /etc/termcap 打印 文件 长 度 
-rw-r--r-- 1 root 702559 Feb 23 2002 /etc/termcap 

$ ./a.out < /etc/termcap > temp.file 先 试 一 普通 文件 
read 500000 bytes 

nwrite = 500000, errno = 0 一 次 写 

$ 1s -1 temp.file 检验 输出 文件 长 度 
-rw-rw-r-- 1 sar 500000 Jul 8 04:19 temp.file 


但 是 ， 若 标准 输出 是 终端 ， 则 期 望 write 有 时 会 返回 小 于 500 000 的 一 个 数字 ， 有 时 则 出 错 返 回 。 
下 面 是 在 一 个 系统 上 运行 上 述 程序 的 结果 : 


$ ./a.out < /etc/termcap 2»stderr.out 输出 至 终端 


大 量 输出 至 终端 …… 


$ cat stderr.out 
read 500000 bytes * 


nwrite 
nwrite 


nwrite 
nwrite 
nwrite 
nwrite 
nwrite 


nwrite 


nwrite 


216041, errno = 0 


-1, errno = 11 这 种 错 1 497 次 …… 
16015, errno = 0 
-1, errno = 11 这 种 错 1 856 次 …… 
32081, errno = 0 
-1, errno = 11 这 种 错 1 654 次 …… 
48002，errno = 0 
-1, errno = 11 这 种 错 1 4602 
等 等 


7949, errno = 0 


在 该 系统 上 ，errno 值 11 对 应 的 是 EAGAIN。 终 端 驱动 程序 一 次 接收 的 数据 量 随 系统 而 变 。 根 
据 你 登录 系统 时 所 使 用 的 不 同方 式 一 一 是 在 系统 控制 台 上 登录 ， 还 是 在 硬 接线 的 终端 上 登录 ， 
或 是 用 伪 终 端 在 网 络 连 接 上 登录 一 一 该 程序 运行 的 结果 也 不 同 。 如 果 你 在 终端 上 在 运行 一 窗口 


系统 ， 那 么 也 是 经 由 伪 终 端 设备 与 系统 交互 。 口 





在 此 实例 中 ， 程 序 发 出 了 数 千 个 write 调用 ， 但 是 只 有 10~20 个 左右 是 真正 输出 数据 的 ， 
其 余 的 则 出 错 返回 。 这 种 形式 的 循环 称 为 轮 询 ， 在 多 用 户 系统 上 它 浪费 了 CPU 时 间 。14.5 节 将 
介绍 非 阻塞 描述 符 的 IO 多 路 转 接 ， 这 是 进行 这 种 操作 的 一 种 比较 有 效 的 方法 。 

有 时 ， 我 们 可 以 将 应 用 程序 设计 成 使 用 多 线程 〈 见 第 11 章 )， 从 而 避免 使 用 非 阻塞 VO。 如 
者 我 们 能 在 其 他 线程 中 继续 进展 ， 则 可 以 允许 某 个 线程 在 MO 调用 中 阻塞 。 这 种 方法 有 时 能 简化 
应 用 程序 的 设计 ( 见 第 21 章 )， 但 是 线程 间 同 步 的 开销 有 了 时 却 可 能 增加 复杂 性 ， 于 是 导致 得 不 


偿 失 的 后 果 。 


14.3 记录 锁 
车 两 个 人 同时 编辑 一 个 文件 ， 其 后 果 将 如 何 呢 ? 在 很 多 UNIX 系 统 中 ， 该 文件 的 最 后 状态 
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取决 于 写 该 文件 的 最 后 一 个 进程 。 但 是 对 于 有 些 应 用 程序 (例如 数据 库 ) ， 进 程 有 时 需要 确保 
它 正 在 单独 写 一 个 文件 。 为 了 向 进程 提供 这 种 功能 ， 商 用 UNIX 系 统 提供 了 记录 锁 机 制 。( 第 20 
章 我 们 开发 了 一 个 使 用 记录 锁 的 数据 库 函 数 库 。) 

记录 锁 (record locking) 的 功能 是 ， 当 一 个 进程 正在 读 或 修改 文件 的 某 个 部 分 时 ， 它 可 以 
阻止 其 他 进程 修改 同一 文件 区 。 对 于 UNIX 系 统 而 言 , “记录 ”这 个 词 是 一 种 误 用 ， 因 为 UNIX 
系统 内 核 根本 没有 使 用 文件 记录 这 种 概念 。 更 适合 的 术语 可 能 是 字 节 范围 锁 (byte-range 
locking)， 因 为 它 锁定 的 只 是 文件 中 的 一 个 区 域 (也 可 能 是 整个 文件 ) 。 

1. 历史 

对 早期 UNIX 系 统 的 一 种 批评 是 它们 不 能 用 来 运行 数据 库 系 统 ， 其 原因 是 这 些 系 统 不 支持 
部 分 地 对 文件 加 锁 。 在 UNIX 系 统 开始 进入 商用 计算 领域 时 ， 很 多 系统 开发 小 组 以 各 种 不 同方 
式 增加 了 对 记录 锁 的 支持 。 

早期 的 伯克利 版 本 只 支持 flock 函 数 。 该 函数 锁 整个 文件 ， 不 能 锁 文 件 中 的 一 部 分 。 

SVR3 通 过 fcnt1 函 数 增加 了 记录 锁 功 能 。 在 此 基础 上 构造 了 lockf 函 数 ， 它 提供 了 一 个 
简化 的 接口 。 这 些 函 数 允 许 调用 者 锁 一 个 文件 中 任意 字 节 数 的 区 域 ， 长 至 整个 文件 ， 短 至 文件 
中 的 一 个 字 节 。 

POSIX.1 标 准 的 基础 是 fcnt1。 表 14-1 列 出 了 各 种 UNIX 系 统 提供 的 不 同形 式 的 记录 锁 。 注 
意 ，Single UNIX Specification 在 其 XSI 扩 展 中 包括 了 lockf。 


表 14-1 各 种 UNIX 系 统 支持 的 记录 锁 形式 


FreeBSD 5.2.1 


Linux 2.4.22 
Mac OS X 10.3 
Solaris 9 


本 节 最 后 部 分 将 说 明 建 议 性 锁 和 强制 性 锁 之 间 的 区 别 。 本 书 只 介绍 POSIX.1 的 fcnt1 锁 。 


记录 锁 是 1980 年 由 John Bass 最 早 加 到 V7 上 的 。 内 核 中 相应 的 系统 调用 入 口 项 是 名 为 locking 的 函 
数 。 此 函数 提供 了 强制 性 记录 镇 功能 ， 它 被 用 在 很 多 System II 版 本 中 。Xenix 系 统 采用 了 此 函数 ， 某 
些 基于 Intel 的 系统 V 派 生 版 本 (例如 OpenServer 5), ， 在 Xenix 兼 容 库 中 仍旧 支持 该 函数 。 





2. fcnt1 记 录 锁 
3.14 节 中 已 经 给 出 了 fcnt1 函 数 的 原型 ， 为 了 叙述 方便 ， 这 里 再 重复 一 次 。 


#include <fcntl.h> 


int fcntl(int filedes, int cmd, ... /* struct flock *flockptr */ ); 
返回 值 ， 若 成 功 则 依赖 于 cmd ( 见 下 )， 若 出 错 则 返回 -1 





对 于 记录 锁 ，cmd 是 F_GCETLK、F_SETLK 或 F_SETLKW。 第 三 个 参数 ( 称 其 为 Pockptr) 是 一 个 
站 向 flock 结 构 的 指针 : 
struct flock { 


short 1 type; /* F_RDLCK, F_WRLCK, or F_UNLCK */ 
off t 1 start; /* offset in bytes, relative to 1 whence */ 
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Short 1 whence; /* SEEK SET, SEEK CUR, or SEEK END */ 
off t 1 len; /* length, in bytes; 0 means lock to EOF */ 
pid t 1 pid; /* returned with F GETLK */ 


对 flock 结 构 说 明 如 下 : 

。 所 希望 的 锁 类 型 ，F_RDLCK (共享 读 锁 ) F_WRLCK (独占 性 写 锁 ) 或 F_UNLCK (解锁 

一 个 区 域 )。 

。 要 加 锁 或 解锁 区 域 的 起 始 字 节 偏 移 量 ， 这 由 1_start 和 1_whence 两 者 决定 。 

。 区 域 的 字 节 长 度 ， 由 1_len 表 示 。 

。 具 有 能 阻塞 当前 进程 的 锁 ， 其 持 有 进程 的 PP 存放 在 1_pidq 中 ( 仅 由 F_GETLK 返 回 )。 

关于 加 锁 和 解锁 区 域 的 说 明 还 要 注意 下 列 各 点 ， 

。1_stat 是 相对 偏 移 量 ( 字 节 )，1_whence 则 决定 了 相对 偏 移 量 的 起 点 。 这 与 1seek 国 

数 ( 见 3.6 节 ) 中 最 后 两 个 参数 类 似 。 确 实 ，1_whence 可 选用 的 值 是 SEEKX_SET、 

SEEK_CURBKSEEK_END, 

。 该 区 域 可 以 在 当前 文件 尾 端 处 开始 或 越过 其 尾 端 处 开始 ， 但 是 不 能 在 文件 起 始 位 置 之 前 

开始 。 

。 如 若 1_1en 为 0， 则 表示 锁 的 区 域 从 其 起 点 (由 1_start 和 1_whence 决 定 ) 开始 直至 最 

大 可 能 偏 移 量 为 止 ， 也 就 是 不 管 添 写 到 该 文件 中 多 少数 据 ， 它 们 都 处 于 锁 的 范围 内 (不 

必 猜 测 会 有 多 少 字 节 被 追加 到 文件 之 后 )。 

。 为 了 锁 整 个 文件 ， 我 们 设置 1_start 和 1_whence， 使 锁 的 起 点 在 文件 起 始 处 ， 并 且说 

明 长 度 (1 len) 为 0。( 有 多 种 方法 可 以 指定 文件 起 始 处 ,但 常用 的 方法 是 将 1_start 

指定 为 0，1_whence 指 定 为 SEEK_SET。) 

上 面 提 到 了 两 种 类 型 的 锁 ， 共 享 读 锁 (1_type 为 F_RDLCK) 和 独占 写 锁 (F_WRLCK), 
基本 规则 是 : 多 个 进程 在 一 个 给 定 的 字 节 上 可 以 有 一 把 共享 的 读 锁 ， 但 是 在 一 个 给 定 字 节 上 只 
能 有 一 个 进程 独 用 的 一 把 写 锁 。 进 一 步 而 言 ， 如 果 在 一 个 给 定 字 节 上 已 经 有 一 把 或 多 把 读 锁 ， 
则 不 能 在 该 字 节 上 再 加 写 锁 ， 如 果 在 一 个 字 节 上 已 经 有 一 把 独占 性 的 写 锁 ， 则 不 能 再 对 它 加 任 
何 读 锁 。 在 表 14-2 示 出 了 这 些 规则 。 


表 14-2 不 同类 型 锁 之 间 的 兼容 性 


请 求 
m | ww | 
mM € E 
[reram | xe | me 
[m | € | ** | 


上 面 说 明 的 兼容 性 规则 适用 于 不 同 进程 提出 的 锁 请 求 ， 并 不 适用 于 单个 进程 提出 的 多 个 锁 
请 求 。 如 果 一 个 进程 对 一 个 文件 区 间 已 经 有 了 一 把 锁 ， 后 来 该 进程 又 企图 在 同一 文件 区 间 再 加 
一 把 锁 ， 那 么 新 锁 将 替换 老 锁 。 例 如 ， 震 一 进程 在 某 文件 的 16~32 字 节 区 间 有 一 把 写 锁 ， 然 后 
又 试图 在 16~32 字 节 区 间 加 一 把 读 锁 ， 那 么 该 请 求 将 成 功 执行 (假定 其 他 进程 此 时 并 不 试图 向 
该 文件 的 同一 区 间 加 锁 )， 原 来 的 写 锁 被 替换 为 读 锁 。 

加 读 锁 时 ， 读 描述 符 必须 是 读 打 开 ， 加 写 锁 时 ， 该 描述 符 必须 是 写 打开 。 

以 下 说 明 fcnt1 函 数 的 三 种 命令 : 











当前 区 域 状态 
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F_GETLK 


F_SETLK 





判断 由 £1lockptr 所 描述 的 锁 是 否 会 被 另外 一 把 锁 所 排斥 (阻塞 )。 如 果 存 在 
一 把 锁 ， 它 阻止 创建 由 flockptz 所 描述 的 锁 ， 则 把 该 现存 锁 的 信息 写 到 
flockptr 指 向 的 结构 中 。 如 果 不 存在 这 种 情况 ， 则 除了 将 1_type 设 置 为 
F_UNLCK 之 外 ，flockptr 所 指向 结构 中 的 其 他 信息 保持 不 变 。 

设置 由 fl1ockptr 所 描述 的 锁 。 如 果 试 图 建立 一 把 读 锁 (1_type 设 为 
F RDLCK) 或 写 锁 (1_type 设 为 F_WRLCK) ， 而 按 上 述 兼容 性 规则 不 能 允 
许 ， 则 fcnt1 立 即 出 错 返回 ， 此 时 errno 设 置 为 BACCES 或 EAGRIN。 


虽然 POSIX 记 许 实现 返回 这 两 太 出 错 代码 中 的 任何 种， 但 未 节 说 明 的 四 种 实现 在 绩 请 求 示 能 得 
到 满足 时 ， 都 返回 EAGAIN。 


F_SETLKW 


此 命令 也 用 来 清除 由 fl1ockptr 说 明 的 锁 (1 typeJXgF UNLCK), 

这 是 F_SETLK 的 阻塞 版 本 (命令 名 中 的 Ww 表示 等 待 (wait))。 如 果 因 为 当前 
在 所 请 求 区 间 的 某 个 部 分 另 一 个 进程 已 经 有 一 把 锁 ， 因 而 按 兼 容 性 规则 由 
flockptz 所 请 求 的 锁 不 能 被 创建 ， 则 使 调用 进程 休眠 。 如 果 请 求 创建 的 锁 
已 经 可 用 ， 或 者 休眠 由 信号 中 断 ， 则 该 进程 被 唤醒 。 


应 当 了 解 ， 用 F_GETLK 测 试 能 否 建立 一 把 锁 ， 然 后 用 F_SETLK 和 F_SETLKW 企 图 建立 一 把 


锁 ， 这 两 者 不 是 一 个 原子 操作 。 因 此 不 能 保证 在 这 两 次 Ecnt1 调 用 之 间 不 会 有 另 一 个 进程 插入 
并 建立 一 把 相关 的 锁 ， 从 而 使 原来 测试 到 的 情况 发 生变 化 。 如 果 不 希 望 在 建立 锁 时 可 能 产生 的 
长 期 阻塞 ， 则 应 使 用 F_SETLK， 并 对 返回 结果 进行 测试 ， 以 判别 是 否 成 功 地 建立 了 所 要 求 的 锁 。 


注意 ，POSIX.1 并 没有 说 明 在 下 列 情况 下 将 发 生 什么 : 一 个 进程 在 某 个 文件 的 一 个 区 间 上 设置 了 


一 把 读 锁 ， 第 二 个 进程 试图 对 同一 文件 区 间 加 一 把 写 锁 时 阻 宣 ， 然 后 第 三 个 进程 则 试图 在 同一 文件 区 


间 上 得 到 另 一 把 读 锁 。 如 果 第 三 个 进程 只 是 因为 读 区 间 已 有 一 把 读 锁 ， 而 被 克 许 在 该 区 间 放 置 另 一 把 


读 锁 ,那么 这 种 实现 就 可 能 会 使 希望 加 写 镇 的 进程 馈 死 。 这 意味 着 ， 当 对 同一 区 间 加 另 一 把 读 锁 的 请 


求 到 达 时 ,提出 加 写 锁 而 阻塞 的 进程 需 等 待 的 时 间 廷 长 了 。 如 果 加 读 锁 的 请 求 来 得 很 频 紫 ， 使 得 该 文 
件 区 间 烤 终 府 在 一 把 或 几 把 读 锁 ， 那 么 欲 加 写 锁 的 进程 就 将 等 待 很 长 时 间 。 


在 设置 或 释放 文件 上 的 锁 时 ， 系 统 按 要 求 组 合 或 裂 开 相 邻 区 。 例 如 ， 若 字 节 100~199 是 加 


锁 的 区 ， 需 解锁 第 150 字 节 ， 则 内 核 将 维持 两 把 锁 ， 一 把 用 于 字 节 100~149， 另 一 把 用 于 字 节 
151~199。 图 14-1 说 明了 这 种 情况 。 


r---- 





100 199 
字 节 100~199 加 锁 后 的 文件 





100 149 151 199 
字 节 150 解 锁 后 的 文件 


图 14-1 文件 字 节 范围 锁 
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假定 我 们 又 对 第 150 字 节 设 置 锁 ， 那 么 系统 将 会 把 三 个 相 邻 的 加 锁 区 合并 成 一 个 区 (ME 
节 100 至 199)。 其 结果 如 图 14-1 中 的 第 一 图 所 示 ， 于 是 我 们 又 回 到 了 出 发 点 。 


嗓 放 一 把 锁 


为 了 避免 每 次 分 配 flock 结 构 ， 然 后 又 填 入 各 项 信息 ， 可 以 用 程序 清单 14-2 中 的 函数 
lock_reg 来 处 理 所 有 这 些 细节 。 


程序 清单 14-2 加 锁 和 解锁 一 个 文件 区 域 的 函数 







#include "apue.h" 
#include «fcntl.h» 


“int 
lock_reg(int fd, int cmd, int type, off t offset, int whence, off t len) 


{ 


struct flock lock; 


lock.1_type = type; /* F_RDLCK, F_WRLCK, F_UNLCK */ 

lock.l start = offset; /* byte offset, relative to 1_whence */ 
lock.l whence = whence; /* SEEK SET, SEEK CUR, SEEK END */ 
lock.l len = len; /* #bytes (0 means to EOF) */ 


return(fcntl(fd, cmd, &lock)); 


) 


因为 大 多 数 锁 调用 是 加 锁 或 解锁 一 个 文件 区 域 (命令 F_GETLK 很 少 使 用 )， 故 通常 使 用 下 
列 5 个 宏 ， 它 们 都 定义 在 apue.h 中 ( 见 附录 B)。 


#define read_lock(fd, offset, whence, len) \ 

lock reg((fd), F_SETLK, F_RDLCK, (offset), (whence), (len)) 
#define readw lock(fd, offset, whence, len) \ 

lock reg((fd), F SETLKW, F RDLCK, (offset), (whence), (len)) 
"define write lock(fd, offset, whence, len) \ 

lock reg((fd), F SETLK, F WRLCK, (offset), (whence), (len)) 
#define writew lock(fd, offset, whence, len) \ 

lock reg((fd), F_SETLKW, F WRLCK, (offset), (whence), (len)) 
#define un_lock(fd, offset, whence, len) \ 

lock reg((fd), F_SETLK, F_UNLCK, (offset), (whence), (Len) ) 


我 们 有 目的 地 用 与 1seek 函 数 同样 的 顺序 定义 这 些 宏 中 的 前 三 个 参数 。 E 








程序 清单 14-3 中 定义 了 一 个 函数 1ock_test， 可 用 其 测试 一 把 锁 。 
程序 清单 14-3 测试 一 个 锁 状 态 的 函数 





#include "apue.h" 
#include «fcntl.h- 


pid t 
lock test(int fd, int type, off t offset, int whence, off t len) 
{ 
44 
struct flock lock; 
lock.l_type = type; /* F_RDLCK or F_WRLCK */ 


lock.1_ start = offset; /* byte offset, relative to 1 whence */ 
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lock.1 whence = whence; /* SEEK_SET, SEEK_CUR, SEEK_END */ 
lock.l len = len; /* #bytes (0 means to EOF) */ 


if (fcntl(fd, F GETLK, &lock) « 0) 
err sys("fcntl error"); 


if (lock.l type -- F UNLCK) 
return(0); /* false, region isn't locked by another proc */ 
return(lock.l pid); /* true, return pid of lock owner */ 


) 





如 果 存 在 一 把 锁 ， 它 阻塞 由 参数 说 明 的 锁 请 求 ， 则 此 函数 返回 持 有 这 把 现存 锁 的 进程 ID， 
否则 此 函数 返回 0。 通常 用 下 面 两 个 宏 来 调用 此 函数 (它们 也 定义 在 apue .h 中 )。 


#define is read lockable(fd, offset, whence, len) V 


(lock test((fd), F RDLCK, (offset), (whence), (len)) == 0) 
#define is write lockable(fd, offset, whence, len) \ 
(lock test((fd), F WRLCK, (offset), (whence), (len)) == 0) 


注意 ， 进 程 不 能 使 用 1ock_test 函 数 测 试 它 自己 是 否 在 文件 的 菜 一 部 分 持 有 一 把 锁 。 
F_GETLK 命 令 的 定义 说 明 ， 返 回信 息 指示 是 否 有 现存 的 锁 阻 止 调用 进程 设置 它 自己 的 锁 。 因 为 
F_SETLK 和 F_SETLKW 命 令 总 是 替换 调用 进程 现存 的 锁 (车 已 存在 ) ， 所 以 调用 进程 决 不 会 阻 
塞 在 自己 持 有 的 锁 上 ， 于 是 ，F_GETLK 命 令 决 不 会 报告 调用 进程 自己 持 有 的 锁 。 E 


如 果 两 个 进程 相互 等 待 对 方 持 有 并 且 锁 定 的 资源 时 ， 则 这 两 个 进程 就 处 于 死 锁 状态 。 如 果 
一 个 进程 已 经 控制 了 文件 中 的 一 个 加 锁 区 域 ， 然 后 它 又 试图 对 另 一 个 进程 控制 的 区 域 加 锁 ， 则 
它 就 会 休眠 ， 在 这 种 情况 下 ， 有 发 生死 锁 的 可 能 性 。 

程序 清单 14-4 给 出 了 一 个 死 锁 的 例子 。 子 进程 锁 字 节 0， 父 进程 锁 字 节 1。 然 后 ， 它 们 又 都 
试图 锁 对 方 已 经 加 锁 的 字 节 。 在 该 程序 中 使 用 了 8.9 节 中 介绍 的 父 、 子 进程 同步 例 程 
(TELL_xxx 和 WAIT_xxx) ,使 得 每 个 进程 能 够 等 待 另 一 个 进程 获得 它 设置 的 第 一 把 锁 。 运 行 
程序 清单 14-4 所 示 程 序 得 到 : 


$ ./a.out 

parent: got the lock, byte 1 

child: got the lock, byte 0 

child: writew lock error: Resource deadlock avoided 
parent: got the lock, byte 0 


程序 清单 14-4 死 锁 检 测 实例 
#include "apue .hn 


#include <fcntl.h> 


static void 
lockabyte(const char *name, int fd, off_t offset) 


if (writew_lock(fd, offset, SEEK_SET, 1) < 0) 
err_sys("%s: writew_lock error", name) ; 
printf ("%s: got the lock, byte %ld\n", name, offset) ; 


} 


int 
main (void) 
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int fd; 

pidt pid; 

/* 
* Create a file and write two bytes to it. 
*/ 


if ((fd = creat ("templock", FILE MODE)) < 0) 
err_sys ("creat error"); 

if (write(fd, "ab", 2) != 2) 
err_sys ("write error"); 


TELL WAIT (); 
if ((pid = fork()) < 0) { 
err_sys ("fork error"); 
} else if (pid == 0) { /* child */ 
lockabyte("child", fd, 0); 
TELL PARENT (getppid()); 
WAIT PARENT(); 
lockabyte("child", fd, 1); 
) eise ( /* parent */ 
lockabyte("parent", fd, 1); 
TELL CHILD (pid); 
WAIT CHILD(); 
lockabyte("parent", fd, 0); 


exit(0); 


) 


检测 到 死 锁 时 ， 内 核 必须 选择 一 个 进程 接收 出 错 返 回 。 在 本 实例 中 选择 了 子 进程 ， 这 是 一 


个 实现 细节 。 在 某 些 系统 上 ， 总 是 子 进程 接 到 出 错 信息 ， 在 另 一 些 系 统 上 ， 总 是 父 进程 接 到 出 
错 信息 。 在 某 些 系统 上 ， 当 试图 使 用 多 把 锁 时 ， 有 时 是 子 进程 接 到 出 错 信息 ， 有 时 则 是 父 进 程 
接 到 出 错 信息 。 口 


3. 锁 的 隐 含 继承 和 释放 

关于 记录 锁 的 自动 继承 和 释放 有 三 条 规则 : 

(D 锁 与 进程 和 文件 两 方面 有 关 。 这 有 两 重 含义 : 第 一 重 很 明显 ， 当 一 个 进程 终止 时 ， 它 
所 建立 的 锁 全 部 释放 ， 第 二 重 意思 就 不 很 明显 ， 任 何 时 候 关闭 一 个 描述 符 时 ， 则 该 进程 通过 这 
一 描述 符 可 以 引用 的 文件 上 的 任何 一 把 锁 都 被 释放 (这些 锁 都 是 该 进程 设置 的 )。 这 就 意味 着 
如 果 执 行 下 列 四 步 : 


fdl = open(pathname, ...); 

read lock(fdl, ...); 

fd2 = dup(fd1); 

close (fd2); 
则 在 close (fdq2) 后 ， 在 fda1 上 设置 的 锁 被 释放 。 如 果 将 qup 换 为 cpen， 以 打开 另 一 描述 符 上 
的 同一 文件 ， 其 效果 也 一 样 ， 

fdl = open(pathname, ...); 

read lock(fdl, ...): 

fd2 - open(pathname, ...) 

close (fd2); 

(2) 由 fork 产 生 的 子 进程 不 继承 父 进程 所 设置 的 锁 。 这 意味 着 ， 若 一 个 进程 得 到 一 把 锁 ， 
然后 调用 fork， 那 么 对 于 父 进程 获得 的 锁 而 言 ， 子 进程 被 视 为 另 一 个 进程 ， 对 于 从 父 进程 处 


bbs.theithome.com 





P 
t2 





364 第 14 章 高 级 IO 


继承 过 来 的 任 一 描述 符 ， 子 进程 需要 调用 fcnt1 才 能 获得 它 自己 的 锁 。 这 与 锁 的 作用 是 相 一 致 
的 。 锁 的 作用 是 阻止 多 个 进程 同时 写 同 一 个 文件 〈 或 同一 文件 区 域 ) 。 如 果子 进程 继承 父 进程 
的 锁 ， 则 父 、 子 进程 就 可 以 同时 写 同 一 个 文件 。 

(3) 在 执行 exec 后 ， 新 程序 可 以 继承 原 执行 程序 的 锁 。 但 是 注意 ， 如 果 对 一 个 文件 描述 符 
设置 了 close-on-exec 标 志 ， 那 么 当 作 为 exec 的 一 部 分 关闭 该 文件 描述 符 时 ， 对 相应 文件 的 所 有 
锁 都 被 释放 了 。 

4. FreeBSD 的 实现 

先 简 要 地 观察 FreeBSD 实 现 中 使 用 的 数据 结构 。 这 会 帮助 我 们 进一步 理解 规则 1: 锁 是 与 进 
程 、 文 件 两 者 相关 联 的 。 

考虑 一 个 进程 ， 它 执行 下 列 语 句 (忽略 出 错 返回 ) : 


fdi = open(pathname, ...); 
write lock(fdl, 0, SEEK SET, 1); /* parent write locks byte 0 */ 
if ((pid = fork()) > 0 { /* parent */ 
fd2 = dup(fdl); 
fd3 = open(pathname, ...); 
} else if (pid == 0) { 
read_lock(fdl, 1, SEEK SET, 1); /* child read locks byte 1 */ 












pause(); 
图 14-2 显 示 了 父 、 子 进程 暂停 后 的 数据 结构 情况 。 

父 进程 表 项 

文件 表 
文件 状态 标志 
fa 标志 stay | /| nitet. 
1 Vuk 
me vido 














struct lockf 





struct lockf 

















图 14-2 关于 记录 锁 的 FreeBSD 数 据 结构 


图 3-3 和 图 8-1 中 已 显示 了 open、fork 以 及 Gup 后 的 数据 结构 。 有 了 记录 锁 后 ， 在 原来 的 这 
些 图 上 新 加 了 lockf 结 构 ， 它 们 由 i 节点 结构 开始 相互 链接 起 来 。 注 意 ， 每 个 lockf 结 构 说 明了 
一 个 给 定 进程 的 一 个 加 锁 区 域 (由 偏 移 量 和 长 度 定义 )。 图 中 显示 了 两 个 lockf 结 构 ， 一 个 是 
由 父 进程 调用 write_lock 形 成 的 ， 另 一 个 则 是 由 子 进 程 调用 read_lock 形 成 的 。 每 一 个 结 
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构 都 包含 了 相应 进程 ID。 

在 父 进程 中 ， 关 闭 fa1、fda2 和 fd3 中 的 任意 一 个 都 将 释放 由 父 进程 设置 的 写 锁 。 在 关闭 
这 三 个 描述 符 中 的 任意 一 个 时 ， 内 核 会 从 该 描述 符 所 关联 的 i 节 点 开始 ， 逐 个 检查 Lockf 链 接 表 
中 各 项 ， 并 释放 由 调用 进程 持 有 的 各 把 锁 。 内 核 并 不 清楚 也 不 关心 父 进程 是 用 哪 一 个 描述 符 来 
设置 这 把 锁 的 。 





在 程序 清单 13-2 中 ， 我 们 了 解 到 ， 守 护 进 程 可 用 一 把 文件 锁 以 保证 只 有 该 守护 进程 的 唯一 副 
本 正在 运行 。 程 序 清单 14-5 示 出 了 lockfile 函 数 的 实现 ， 守 护 进程 可 用 该 函数 在 文件 上 加 锁 。 


程序 清单 14-5 在 文件 整体 上 加 锁 


#include <unistd.h> 
#include <fentl.h> 
int 

lockfile(int fd) 

( 


struct flock f1; 


fl.1 type = F_WRLCK; 

fl.l start = 0; 

f1.1_whence = SEEK SET; 

f1.1 len = 0; 

return (fentl (fd, F SETLK, &f1)); 


) 
另 一 种 方法 是 ， 用 write_lock 函 数 定义 lockfile 函 数 : 


#define lockfile(fd) write_lock((fd), 0, SEEK SET, 0) 

5. 在 文件 尾 端 加 锁 
”在 接近 文件 尾 端 加 锁 或 解锁 时 需要 特别 小 心 。 大 多 数 实 现 按照 L_whence 的 SEEK_CUR 或 
SEEK_END 值 ， 用 1_start 以 及 文件 当前 位 置 或 当前 长 度 得 到 绝对 文件 偏 移 量 。 但 是 ， 常 常 需 
要 相对 于 文件 的 当前 位 置 或 当前 长 度 指 定 一 把 锁 。 其 原因 是 ， 我 们 在 该 文件 上 没有 锁 ， 所 以 不 
能 调用 lseex 以 正确 无 误 地 获得 加 锁 时 的 当前 文件 偏 移 量 。( 在 1seexk 和 加 锁 调 用 之 间 ， 另 一 
个 进程 可 能 改变 该 文件 长 度 。) 

考虑 以 下 代码 序列 ， 


口 


writew_lock(fd, 0, SEEK_END, 0); 
write(fd, buf, 1); 

un_lock(fd, 0, SEEK_END) ; 
write(fd, buf, 1); 


该 代码 序列 所 做 的 可 能 并 不 是 你 所 期 望 的 。 它 得 到 一 把 写 锁 ， 该 写 锁 从 当前 文件 尾 端 起 ， 包 括 
以 后 可 能 添加 到 该 文件 的 任何 数据 。 假 定 在 文件 尾 端 时 执行 第 一 个 write， 它 给 文件 添 写 了 1 
个 字 节 ， 而 该 字 节 将 被 加 锁 。 跟 随 其 后 的 解锁 ， 其 作用 是 对 以 后 添 写 到 文件 上 的 数据 不 再 加 锁 ， 
但 在 它 之 前 刚 添 写 的 一 个 字 节 则 保留 加 锁 。 当 执行 第 二 个 写 时 ,文件 尾 端 又 延伸 了 1 个 字 节 ， 
但 该 字 节 并 未 加 锁 。 由 此 代码 序列 造成 的 文件 锁 状 态 示 于 图 14-3。 

当 对 文件 的 一 部 分 加 锁 时 ， 内 核 将 指定 的 偏 移 量变 换 成 绝对 文件 偏 移 量 。 另 外 ， 除 了 指定 
一 个 绝对 偏 移 量 (SEEK SET) 之 外 ，fcnt1 还 允许 我 们 相对 于 文件 中 的 某 个 点 (当前 偏 移 量 
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(SEEK CUR) 或 文件 尾 端 (SEEK END)) 指定 该 偏 移 量 。 当 前 偏 移 量 和 文件 尾 端 是 可 能 不 断 
变化 的 ， 而 这 种 变化 又 不 应 影响 现存 锁 的 状态 ， 所 以 内 核 必须 独立 于 当前 文件 偏 移 量 或 文件 尾 
端 而 记 住 锁 。 


锁 住 
je — 


第 一 个 字 节 | 第 二 个 字 节 
es uh 





如 果 我 们 想 解 除 第 一 次 write 所 写 1 个 字 节 上 的 锁 ， 那 么 应 指定 长 度 为 一 1 。 负 的 长 度 值 表 
示 在 指定 偏 移 量 之 前 的 字 节 数 。 

6. 建议 性 锁 和 强制 性 锁 

考虑 数据 库 访 问 例 程 库 。 如 果 该 库 中 所 有 函数 都 以 一 致 的 方法 处 理 记 录 锁 ， 则 称 使 用 这 些 
函数 访问 数据 库 的 任何 进程 集 为 合作 进程 (cooperating process), 。 如 果 这 些 函 数 是 仅 有 地 用 来 
访问 数据 库 的 函数 ， 那 么 它们 使 用 建议 性 锁 是 可 行 的。 但 是 建议 性 锁 并 不 能 阻止 对 数据 库 文件 
有 写 权限 的 任何 其 他 进程 对 数据 库 文 件 进行 随意 的 写 操作 。 没 有 使 用 被 认可 的 方法 (数据 库 函 
数 库 ) 访问 数据 库 的 进程 是 一 个 非 合 作 进程 。 

强制 性 锁 使 内 核对 每 一 个 open、read 和 write 系统 调用 都 进行 检查 ， 检 查 调 用 进程 对 正 
在 访问 的 文件 是 否 违背 了 某 一 把 锁 的 作用 。 强 制 性 锁 有 时 也 被 称 为 强迫 方式 镇 (enforcement- 
mode locking) , 


KAN4-14 41, Linux 2.4.22 和 Solaris 9 提供 强制 性 记录 和 锁 ， 而 FreeBSD 5.2.1 和 Mac OS X 10.3 则 不 
提供 。 强 制 性 记录 锁 不 是 Single UNIX Specification 的 组 成 部 分 。 在 Linux 中 ， 如 果 用 户 想 要 使 用 强制 性 
锁 ， 则 要 在 各 个 文件 系统 基础 上 、 对 mount 命 令 用 _omand 选 项 打开 该 机 制 。 


对 一 个 特定 文件 打开 其 设置 组 ID 位 并 关闭 其 组 执行 位 ， 则 对 该 文件 开启 了 强制 性 锁 机 制 
(回忆 程序 清单 4-4)。 因 为 当 组 执行 位 关闭 时 ， 设 置 组 ID 位 不 再 有 意义 ， 所 以 SVR3 的 设计 者 借 
用 两 者 的 这 种 组 合 来 指定 对 一 个 文件 的 锁 是 强制 性 的 而 非 建议 性 的 。 

如 果 一 个 进程 试图 读 、 写 一 个 强制 性 锁 起 作用 的 文件 ， 而 欲 读 、 写 的 部 分 又 由 其 他 进程 加 
上 了 读 或 写 锁 ， 此 时 会 发 生 什么 呢 ? 对 这 一 问题 的 回答 取决 于 三 方面 的 因素 :操作 类 型 
(reaq 或 write)， 其 他 进程 保有 的 锁 的 类 型 ( 读 锁 或 写 锁 ) ， 以 及 有 关 描 述 符 是 阻塞 还 是 非 阻 
塞 的 。 表 14-3 列 出 了 8 种 可 能 性 。 

除了 表 14-3 中 的 read 和 wri te 函数 ， 其 他 进程 持 有 的 强制 性 锁 也 会 对 open 函 数 产生 影响 。 
通常 ， 即 使 正在 打开 的 文件 具有 强制 性 记录 锁 ， 该 打开 操作 也 会 成 功 。 后 随 的 read 或 wri te 
依从 于 表 14-3 中 所 示 的 规则 。 但 是 ， 如 果 欲 打开 的 文件 具有 强制 性 记录 锁 ( 读 锁 或 写 锁 )， 而 
且 open 调 用 中 的 flag 指 定 为 0 TRUNC 或 0_CcREAT， 则 不 论 是 否 指定 0_NONBLOCK，open 都 
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立即 出 错 返 回 ，errno 设 置 为 EAGAIN。 
表 14-3 强制 性 锁 对 其 他 进程 读 、 写 的 影响 


其 他 进程 在 文件 E UT 
Ue Rein, RA 非 阻塞 描述 符 ， 试 图 


sue 





RA Solarist}O_CREAT#ERBALB, BIAF-FABWRAHLEH, Linux Hse 
Q_CREAT 标 志 。 对 O_TRUNC 标 志 产 生 open 出 错 是 有 道理 的 ， 因 为 若 其 他 进程 对 该 文件 持 有 读 、 写 锁 ， 
那么 就 不 能 将 其 截 短 为 0。 对 CO_CREAT 标 志 在 返回 时 也 设置 errno 则 无 道理 ， 因 为 该 标志 的 意义 是 如 果 
该 文件 不 存在 则 创建 ， 由 于 其 他 进程 对 该 文件 持 有 记录 人 锁 ， 因 而 该 文件 表 定 是 存在 的 。 


这 种 cpen 的 锁 冲 突 处 理 方式 可 能 导致 令 人 惊异 的 结果 。 我 们 曾 编写 过 一 个 测试 程序 ， 它 
打开 一 个 文件 (其 模式 指定 为 强制 性 锁 )， 然 后 对 该 文件 的 整体 设置 一 把 读 锁 ， 然 后 进入 休眠 
一 段 时 间 。( 回 忆 表 14-3， 读 锁 应 当 阻止 其 他 进程 写 该 文件 。) 在 这 段 休眠 时 间 内 ， 用 某 些 典型 
的 UNIX 系 统 程序 和 操作 符 对 该 文件 进行 处 理 ， 发 现下 列 情况 : 

* 可 用 ed 编辑 程序 对 该 文件 进行 编辑 操作 ， 而 且 编 辑 结果 可 以 写 回 磁盘 ! 强制 性 记录 锁 对 

此 毫 无 影响 。 用 某 些 UNIX 系 统 版 本 提供 的 系统 调用 跟踪 特性 ， 对 ed 操作 进行 跟踪 分 析 发 

现 ，ed 将 新 内 容 写 到 一 个 临时 文件 中 ， 然 后 删除 原文 件 ， 最 后 将 临时 文件 名 改 为 原文 件 

名 。 强 制 性 锁 机 制 对 unlink 函 数 没 有 影响 ， 于 是 这 一 切 就 发 生 了 。 


在 Solaris 中 ， 用 truss(1) 命 令 可 以 得 到 一 个 进程 的 系统 调用 跟踪 信息 ， 在 FreeBSD 和 Mac OS X, 
则 使 用 ktrace(1) 和 kdump(1) 命 令 。Linux 提 供 strace(1) 命 令 跟 踪 进 程 的 系统 调用 。 


。 不 能 用 vi 编辑 程序 编辑 该 文件 。vi 可 以 读 该 文件 ， 但 是 如 果 试 图 将 新 的 数据 写 到 该 文件 
中 ， 则 出 错 返 回 〈EAGAIN) 。 如 果 试 图 将 新 数据 添加 到 该 文件 中 ， 则 write 阻塞 。vi 的 
这 种 行为 与 所 预料 的 一 样 。 

。 使 用 Korn shell 的 > 和 >> 运 算 符 重 写 或 添 写 到 该 文件 中 ， 产 生出 错 信息 “cannot create", 

。 在 Bourne shell 下 使 用 > 运算 符 出 错 ， 但 是 使 用 >> 运 算 符 则 阻塞 ， 在 解除 了 强制 性 锁 后 再 
继续 进行 处 理 。( 这 两 种 shell 在 执行 添加 操作 时 会 产生 这 样 的 区 别 ， 是 因为 Korn shell 以 
0_CREAT 和 0_APPEND 标 志 打 开 文 件 ， 上 面 已 提 及 指定 0_CREAT 会 产生 出 错 返 回 ， 而 
Bourne shell 在 该 文件 已 存在 时 并 不 指定 0_CREAT， 所 以 open 成 功 ， 而 下 一 个 write 则 
阻塞 。) 

产生 的 结果 随 所 用 操作 系统 版 本 的 不 同 而 变 。 从 这 样 一 个 例子 中 可 见 ， 在 使 用 强制 性 锁 时 还 需 
有 所 人 警惕。 从 eda 实 例 可 以 看 到 ， 强 制 性 锁 是 可 以 设法 避 开 的 。 

一 个 别有用心 的 用 户 可 以 对 大 家 都 可 读 的 文件 加 一 把 读 锁 (强制 性 )， 这 样 就 能 阻止 任何 
其 他 人 写 该 文件 (当然 ,该 文件 应 当 是 强制 性 锁 机 制 起 作用 的 ， 这 可 能 要 求 该 用 户 能 够 更 改 该 
文件 的 权限 位 )。 考 虑 一 个 数据 库 文件 ， 它 是 大 家 都 可 读 的 ， 并 且 是 强制 性 锁 机 制 起 作用 的 。 
如 果 一 个 别有用心 的 用 户 对 该 整个 文件 保有 一 把 读 锁 ， 则 其 他 进程 不 能 再 写 该 文件 。 
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程序 清单 14-6 用 于 确定 一 个 系统 是 否 支持 强制 性 锁 机 制 。 


程序 清单 14-6 ”确定 是 否 支持 强制 性 锁 





#include "apue.h" 
#include «errno.h» 
#include «fcntl.h» 
#include <sys/wait.h> 


int 


main(int argc, char *argv[]) 


{ 


int fd; 

pid t pid; 
char buf [5] ; 
struct stat statbuf; 


if (argc != 2) { 
fprintf(stderr, "usage: ts filename\n", argv[0]); 
exit (1); 
) 
if ((fd = open(argv[1], O_RDWR | O CREAT | O TRUNC, FILE MODE)) « 0) 
err 8ys("open error"); 
if (write(fd, "abcdef", 6) != 6) 
err sys("write error"); 


/* turn on set-group-ID and turn off group-execute */ 

if (fstat(fd, &statbuf) « 0) 
err sys("fstat error"); 

if (fchmod(fd, (statbuf.st mode & ^S IXGRP) | S ISGID) « 0) 
err sys("fchmod error"); 


TELL WAIT(); 


if ((pid = fork()) < 0) { 
err Sys("fork error"); 
} else if (pid > 0) { /* parent */ 
/* write lock entire file */ 
if (write lock(fd, 0, SEEK SET, 0) « 0) 
err sys ("write lock error"); 


TELL CHILD(pid); 


if (waitpid(pid, NULL, 0) « 0) 
err_sys("waitpid error"); 
) eise { /* child */ 
WAIT PARENT(); /* wait for parent to set lock */ 


set fl(fd, O NONBLOCK); 


/* first let's see what error we get if region is locked */ 
if (read lock(fd, 0, SEEK SET, 0) !- -1) /* no wait */ 
err Sys("child: read lock succeeded"); 
printf("read lock of already-locked region returns %d\n", 
errno); 


/* now try to read the mandatory locked file */ 

if (lseek(fd, 0, SEEK_SET) == -1) 
err_sys("lseek error"); 

if (read(fd, buf, 2) < 0) 
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err ret("read failed (mandatory locking works)"); 
else 
printf("read OK (no mandatory locking), buf = %2.2s\n", 
buf); 


exit (0); 


此 程序 首先 创建 一 个 文件 ， 并 使 强制 性 锁 机 制 对 其 起 作用 。 然 后 程序 分 烈 为 父 进程 和 子 进 


程 。 父 进程 对 整个 文件 设置 一 把 写 锁 ， 子 进程 则 将 该 文件 的 描述 符 设置 为 非 阻塞 的 ， 然 后 企图 
对 该 文件 设置 一 把 读 锁 ， 我 们 期 望 这 会 出 错 返 回 ， 并 希望 看 到 系统 返回 是 EACCES 或 BRGRATN。 
接着 ， 子 进程 将 文件 读 、 写 位 置 调整 到 文件 起 点 ， 并 试图 读 (read) 该 文件 。 如 果 系 统 提供 
强制 性 锁 机 制 ， 则 read 应 返回 EACCES 或 EAGAIN (因为 该 描述 符 是 非 阻塞 的 ) ， 否 则 *ead 返 
回 所 读 的 数据 。 在 Solaris 9 运行 此 程序 (该 系 统 支持 强制 性 锁 机 制 )， 得 到 ; 

5 ./a.out temp.lock 


read_lock of already-locked region returns 11 
read failed (mandatory locking works): Resource temporarily unavailable 


查看 系统 头 文件 或 intzo(2) 手 册页 ， 可 以 看 到 erzrno 11 对 应 于 EAGAIN。 若 在 FreeBSD 5.2.1 
运行 此 程序 ， 则 得 到 : 
$ ./a.out temp.lock 


read lock of already-locked region returns 35 
read OK (no mandatory locking), buf - ab 


其 中 ，errno 35 对 应 于 EAGAIN。 该 系统 不 支持 强制 性 锁 。 

















让 我 们 回 到 本 节 的 第 一 个 问题 ， 若 两 个 人 同时 编辑 同一 个 文件 将 会 怎样 呢 ? 一 般 的 UNIX 
系统 文本 编辑 器 并 不 使 用 记录 锁 ， 所 以 对 此 问题 的 回答 仍然 是 ， 该 文件 的 最 后 结果 取决 于 写 该 
文件 的 最 后 一 个 进程 。 

某 些 版 本 的 vi 编辑 器 使 用 建议 性 记录 锁 。 即 使 我 们 正在 使 用 这 种 版 本 的 vi 编辑 器 ， 但 是 
它 并 不 能 阻止 其 他 用 户 使 用 另 一 个 没有 使 用 建议 性 记录 锁 的 编辑 器 。 

若 系统 提供 强制 性 记录 锁 ， 那 么 我 们 可 以 修改 自己 常用 的 编辑 器 (如 果 有 该 编辑 器 的 源 
代码 ) 。 如 没有 该 编辑 器 的 源 代码 ， 那 么 可 以 试 一 试 下 述 方法 。 编 写 一 个 vi 的 前 端 程序 。 该 
程序 立即 调用 fork， 然 后 父 进程 等 待 子 进程 终止 ， 子 进程 打开 在 命令 行 中 指定 的 文件 ， 使 强 
制 性 锁 起 作用 ， 对 整个 文件 设置 一 把 写 锁 , 然后 执行 vi 。 在 vi 运行 时 ,该 文件 是 加 了 写 锁 的 ， 
所 以 其 他 用 户 不 能 修改 它 。 当 vi 结束 时 ， 父 进程 从 wait 返 回 ， 此 时 自 编 的 前 端 程序 也 就 结 
XT. 

这 种 类 型 的 前 端 程序 是 可 以 编写 的 ， 但 却 往 往 不 能 起 作用 。 问 题 出 在 大 多 数 编辑 器 通常 在 
读 完 输入 文件 后 关闭 它 。 只 要 引用 被 编辑 文件 的 描述 符 关 闭 了 ， 那 么 加 在 该 文件 上 的 锁 就 被 释 
放 了 。 这 意味 着 ， 编 辑 器 读 了 该 文件 的 内 容 后 ， 随 即 关 闭 了 该 文件 ， 那 么 锁 也 就 不 存在 了 。 前 
端 程序 中 没有 任何 方法 可 以 阻止 这 一 点 。 口 


第 20 章 的 数据 库 函 数 库 使 用 了 记录 锁 以 提供 多 个 进程 的 并 发 访问 。 该 章 也 提供 了 定时 测量 
数据 ， 以 观察 记录 锁 对 进程 的 影响 。 
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14.4 STREAMS 


STREAMS (Wi) 是 系统 V 提 供 的 构造 内 核 设备 驱动 程序 和 网 络 协议 包 的 一 种 通用 方法 ， 对 
STREAMS 进 行 讨论 的 目的 是 为 了 理解 系统 V 的 终端 接口 ，LO 多 路 转 接 中 poll ( 轮 询 ) 函数 的 
使 用 ( 见 14.5.2 节 )， 以 及 基于 STREAMS 的 管道 和 命名 管道 的 实现 ( 见 17.2 节 和 17.2.1 节 )。 


请 注意 不 要 将 本 章 说 明 的 STREAMS ( 流 ) SEROR ( 见 5.2 节 ) 中 使 用 的 流 (stream) MH. 
流 机 制 是 由 Dennis Ritchie 开 发 的 [Ritchie 1984]， 其 目的 是 用 通用 、 灵活 的 方法 改写 传统 的 字符 UO 系统 
(c-list) 并 与 网 络 协议 相 适应 ， 后 来 销 加 增强 名称 改 用 大 写字 母 ， 成 为 STREAMS 机 制 ， 被 加 入 到 
SVR3。SVR4 则 提供 了 对 STREAMS 的 全 面 支持 〈 亦 即 ， 一 个 基于 STREAMS 的 终端 UO 系 统 ) , [AT&T 
1990d] 对 SVR4 实 现 进 行 了 说 明 。Rago[1993] 讨 论 了 用 户 层 的 STREAMS 编 程 和 内 核 层 的 STREAMS 编 程 ， 


在 Single UNIX Specification? . STREAMS —4* T #4444444 (XSI STREAMS Option Group) 。 
在 本 书 讨论 的 四 种 平台 中 ， 只 有 Solaris 对 STREAMS 提 供 了 很 自然 的 支持 。 在 Linux 中 . STREAMS & 
统 是 可 用 的 ， 但 是 用 户 必 须 自行 将 该 子 系统 安装 到 系统 中 ， 通 常 它 默 认为 不 包括 碍 系统 市 


流 在 用 户 进程 和 设备 驱动 程序 之 间 提 供 了 一 条 全 双 工 通路 。 流 无 需 和 实际 硬件 设备 直接 会 
话 ， 流 也 可 以 用 来 构造 伪 设 备 驱动 程序 。 图 14-4 示 出 了 一 个 简单 流 (simple stream) 的 基本 结构 。 

在 流 首 (stream head) 之 下 可 以 压 人 处 理 模块 。 这 可 以 用 ioct1 命 令 实现 。 图 14-5 示 出 了 
包含 一 个 处 理 模块 的 流 。 各 方 框 之 间 用 两 根 带 箭头 的 线 连接 ， 以 突出 流 的 全 双 工 特征 ， 并 强调 
两 个 方向 的 处 理 是 相互 独立 进行 的 。 


cma 
用 户 进程 





下 7 

! ' 顺 流 | 

i | | 

! | (系统 调用 界面 ) | ， i 

| ! NEL LE 

1 | 设备 驱动 程序 (或 | a 

NL i | 

I ! 1 

mem. ee < ^ " 逆流 
图 14-4 一 个 简单 流 图 14-5 具有 处 理 模 块 的 流 


任意 数量 的 处 理 模块 可 以 压 和 人流 。 我 们 使 用 术语 压 入 ， 是 因为 每 一 新 模块 总 是 插 到 流 首 之 
下 ， 而 将 以 前 的 模块 下 压 。( 这 类 似 于 后 进 先 出 的 栈 。) 图 14-5 标 出 了 流 的 两 侧 ， 分 别称 为 顺 流 
(downstream) 和 逆流 (upstream)。 写 到 流 首 的 数据 将 顺 流 而 下 传送 ， 由 设备 驱动 程序 读 到 的 
数据 则 逆流 向 上 传送 。 

STREAMS 模 块 是 作为 内 核 的 一 部 分 执行 的 ， 这 类 似 于 设备 驱动 程序 。 当 构造 内 核 时 ， 
STREAMS 模 块 联 编 进入 内 核 。 如 果 系 统 支持 动态 可 装 人 的 内 核 模块 (Linux 和 Solaris 是 这 样 做 
的 ) ， 则 我 们 可 以 试图 将 没有 联 编 进 内 核 的 STREAMS 模 块 压 入 一 个 流 ， 但 不 保证 STREAMS 模 
块 和 驱动 程序 的 任意 组 合 将 能 正常 工作 。 

用 第 3 章 中 说 明 的 函数 访问 流 ， 它 们 是 : open, close, read, writeflioctl, 另外 ， 
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ZTESVR3 AK PH 737 KR ER (getmsg, putmsg#lpoll), 在 SVR4 中 又 加 了 两 
个 处 理 流 内 不 同 优先 级 波段 消息 的 函数 (getpmsg 和 putpmsg)。 本 节 将 说 明 这 5 个 新 函数 。 
打开 (open) 流 时 使 用 的 路 径 名 参数 通常 在 /dev 目 录 之 下 。 仅 仅 用 1s -1 查看 设备 名 ， 不 
能 判断 该 设备 是 不 是 STREAMS 设 备 。 所 有 STREAMS 设 备 都 是 字符 特殊 文件 。 
虽然 某 些 有 关 STREAMS 的 文献 暗示 我 们 可 以 编写 处 理 模块 ， 并 且 不 加 细 究 地 就 可 将 它们 
压 入 流 中 ,但 是 编写 这 些 模 块 如 同 编写 设备 驱动 程序 一 样 ， 需 要 专门 的 技术 。 通 常 只 有 特殊 的 
应 用 程序 或 函数 才 压 人 和 弹出 STREAMS 模 块 。 


在 STREAMS 之 前 .终端 是 用 现存 的 c-list 机 制 处 理 的 。(Bach[1986] 的 10.3.1 节 和 McKusick 等 [1996] 的 
10.6 节 分 别 说 明 SVR2 和 4.4BSD 中 的 c-list 机 制 。) 将 基于 字符 的 其 他 设备 添加 到 内 核 中 通常 涉及 编写 设 
备 驱 动 程 序 ， 并 将 所 有 有 关 部 分 都 安排 在 驱动 程序 中 。 对 新 设备 的 访问 典型 地 通过 原始 设备 进行 ， 这 
意味 着 每 个 用 户 的 read，write 最 后 都 直通 进入 设备 驱动 程序 。 流 机 制 使 这 种 交互 作用 方式 更 加 灵活 
且 条 理 清晰 ， 使 得 数据 可 以 用 STREAMS 消 息 方 式 在 流 首 和 驱动 程序 之 间 传 送 ， 并 使 任意 数 的 中 则 处 理 
模块 可 对 数据 进行 操作 。 


1. STREAMS 消 息 

STREAMS 的 所 有 输入 和 输出 都 基于 消息 。 流 首 和 用 户 进程 使 用 reaQ、write、ioct1l1、 
getmsg、getpmsg、putmsg 和 putpmsg 交 换 消 息 。 在 流 首 、 各 处 理 模块 和 设备 驱动 程序 之 
间 ， 消 息 可 以 顺 流 而 下 ， 也 可 以 逆流 而 上 。 

在 用 户 进 程 和 流 首 之 间 ， 消 息 由 下 列 几 部 分 组 成 :消息 类 型 、 可 选择 的 控制 信息 以 及 可 选 
择 的 数据 。 表 14-4 列 出 了 对 应 于 write、putmsg 和 putpmsg 的 不 同 参数 所 产生 的 不 同 消息 类 
型 。 控 制 信息 和 数据 由 strbuf 结 构 指定 : 


struct strbuf 

int maxlen; /* size of buffer */ 

int len; /* number of bytes currently in buffer */ 
char *buf; /* pointer to buffer */ 


Le 
当 用 putmsg 或 putpmsg 发 送 消 息 时 ，1en 指 定 缓 冲 区 中 数据 的 字 节 数 。 当 用 getmsg 或 
getpmsg 接 收 消息 时 ，maxlen 指 定 缓冲 区 长 度 (使 内 核 不 会 溢出 缓冲 区 )， 而 len 则 由 内 核 设 
置 为 存放 在 缓冲 区 中 的 数据 量 。 消 息 长 度 为 0 是 允许 的 ，len 为 -1 说 明 没 有 控制 信息 或 数据 。 

为 什么 需要 传送 控制 信息 和 数据 两 者 呢 ? 提 供 这 两 者 使 我 们 可 以 实现 用 户 进 程 和 流 之 间 的 服 
务 接口 。Olander, McGrath 和 lsrael[1986] 说 明了 系统 V 服 务 接口 的 原先 实现 。AT&T[1990d] 第 5 章 详 
细 说 明了 服务 接口 ， 还 使 用 了 一 个 简单 的 实例 。 可 能 最 为 人 了 解 的 服务 接口 是 系统 V 的 传输 层 接 
H (Transport Layer Interface，TLI)， 它 提供 了 网 络 系统 接口 ，Rago {1993] 第 4 章 对 此 进行 了 说 明 。 

控制 信息 的 另 一 个 例子 是 发 送 一 个 无 连接 的 网 络 消息 (数据 报 )。 为 了 发 送 该 消息 ， 需 要 
说 明 消 息 的 内 容 (数据 ) 和 该 消息 的 目的 地 址 (控制 信息 )。 如 果 不 能 将 数据 和 控制 一 起 发 送 ， 
那么 就 要 某 种 专门 设计 的 方案 。 例 如 ， 可 以 用 ioct1 说 明 地 址 ， 然 后 用 write 发 送 数据 。 另 一 
种 技术 可 能 要 求 地 址 占用 数据 的 前 N 个 字 节 ， 而 数据 是 用 write 写 的 。 将 控制 信息 与 数据 分 开 ， 
并 且 提 供 处 理 两 者 的 函数 (putmsg 和 getmsg) 是 处 理 这 种 问题 的 较 清晰 的 方法 。 

有 约 25 种 不 同类 型 的 消息 ， 但 是 只 有 少数 几 种 用 于 用 户 进程 和 流 首 之 间 ， 其 余 的 只 在 内 核 
中 顺 流 、 逆 流传 送 。( 对 于 编写 流 处 理 模 块 的 人 员 而 言 ， 这 些 消息 是 非常 有 用 的 ， 但 是 对 编写 
用 户 级 代码 的 人 员 而 言 ， 它 们 可 以 忽略 。) 在 我 们 所 使 用 的 函数 (read, write, getmsg, 
getpmsg、putmsg 和 putpmsg) 中 ， 只 涉及 三 种 消息 类 型 ， 它 们 是 : 
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*M DATA (IO 的 用 户 数据 ) 。 

*M PROTO (协议 控制 信息 ) 。 

*M_PCPROTO (高 优先 级 协议 控制 信息 )。 
流 中 的 消息 都 有 一 个 排队 优先 级 ， 

。 高 优先 级 消息 (最 高 优先 级 )。 

“优先 级 波段 消息 。 

* 普通 消息 (最低 优 先 级 )。 
普通 消息 是 优先 级 波段 为 0 的 消息 。 优 先 级 波段 消息 的 波段 可 在 1~255 之 间 ， 波 段 愈 高 ， 优 先 级 
也 愈 高 。 高 优先 级 消息 的 特殊 性 在 于 ， 在 任何 时 刻 流 首 只 有 一 个 高 优先 级 消息 排队 。 在 流 首 读 
队列 已 有 一 个 高 优先 级 消息 时 ， 另 外 的 高 优先 级 消息 会 被 丢弃 。 


表 14-4 write、putmsg 和 putpmsg 产 生 的 STREAMS 消 息 类 型 


产生 的 消息 类 型 
pwie | wA | @ | N& | MW | wor CH) 
putmsg 5 8 0 不 发 送 消息 ， 返 回 0 
M_DATA (普通 ) 


IM 


putmsg 
putmsg 


0 M PROTO (普通 ) 
RS, HIPRI M PCPROTO (高 优先 级 ) 
RS_HIPRI 出 错 ，EINVAL 


putmsg 


putmsg 
putpmsg 0 出 错 ，EINVAL 
MSG_BAND 不 发 送 消 息 ， 返 回 0 
MSG_BAND M, DATA (普通 ) 


MSG, BAND M DATA (优先 级 波段 ) 
MSG_BAND M_PROTO (普通 ) 
MSG_BAND M_PROTO (优先 级 波段 ) 
putpmsg MSG_HIPRI M PCPROTO (高 优先 级 ) 
putpmsg MSG_HIPRI 出 错 ，EINVAL 
putpmsg MSG_HIPRI 出 错 ，EINVAL 


每 个 STREAMS 模 块 有 两 个 输入 队列 。 一 个 接收 来 自 它 上 面 模块 的 消息 ， 这 种 消息 从 流 首 
向 驱动 程序 顺 流传 送 。 另 一 个 接收 来 自 它 下 面 模块 的 消息 ， 这 种 消息 从 驱动 程序 向 流 首 逆 流传 
送 。 在 输入 队列 中 的 消息 按 优先 级 从 高 到 低 排 列 。 表 14-4 列 出 了 针对 write、putmsg 和 
putpmsg 的 不 同 参数 ， 产 生 不 同 优 先 级 的 消息 。 

有 一 些 消 息 我 们 未 加 考虑 。 例 如 ， 若 流 首 从 它 下 面 接收 到 M_sIG 消 息 ， 则 产生 一 信和 号。 这 
种 方法 用 于 终端 行规 程 模块 向 具有 控制 终端 的 前 台 进 程 组 发 送 终端 产生 的 信和 号 。 

2. putmsg 和 putpmsg 函 数 

putmsg 和 putpmsg 函 数 用 于 将 STREAMS 消 息 (控制 信息 或 数据 ， 或 两 者 ) 写 至 流 中 。 
这 两 个 函数 的 区 别 是 后 者 允许 对 消息 指定 一 个 优先 级 波段 。 


#include <stropts.h> 


putpmsg 
putpmsg 
putpmsg 
putpmsg 
putpmsg 


D fm Aim Bm ON ON DM Se ON di Aim oN 





int putmsg(int filedes, const struct strbuf *ctlptr , 
const struct strbuf *dataptr, int flag); 


int putpmsg (int filedes, const struct strbuf *ctlptr , 
const struct strbuf *dataptr, int band, int flag); 


两 个 函数 返回 值 ， 若 成 功 则 返回 9， 若 出 错 则 返回 -1 
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对 流 也 可 以 使 用 write 函 数 ， 它 等 效 于 不 带 任何 控制 信息 、fiag 为 0 的 putmsg。 

这 两 个 函数 可 以 产生 三 种 不 同 优先 级 的 消息 : 普通 、 优 先 级 波段 和 高 优先 级 。 表 14-4 详 细 
列 出 了 这 两 个 函数 中 几 个 参数 的 各 种 可 能 组 合 ， 以 及 所 产生 的 不 同类 型 的 消息 。 

在 表 14-4 中 ，N/A 表 示 不 适用 。 消 息 控 制 列 中 的 “ 否 ” 对 应 于 空 ctlptr 参 数 ， 或 ctlptr->len 
为 1。 该 列 中 的 “是 ”对 应 于 ctlptr 非 室 ， 以 及 ctlptr->len 大 于 等 于 0。 这 些 说 明 同 样 适用 于 消 
息 的 数据 部 分 (用 dataprr 代 替 criptr) 。 

3. STREAMS ioct1 操 作 

3.15 节 曾 提 到 过 ioct1 函 数 ， 它 能 做 其 他 MO 函数 不 处 理 的 事情 。STREAMS 系 统 继承 了 这 
种 传统 。 

在 Linux 和 Solaris 中 ， 使 用 ioct1 可 对 流 执行 将 近 40 种 不 同 的 操作 。 其 中 大 多 数 操作 的 说 明 
请 见 streamio(7) 手 册页 。 头 文件 <stropts .h> 应 包括 在 使 用 这 些 操作 的 C 代 码 中 。ioct1 
的 第 二 个 参数 request 说 明 执行 哪 一 个 操作 。 所 有 request 都 以 I_ 开 始 。 第 三 个 参数 的 作用 与 
request 有 关 ， 有 时 它 是 一 个 整 型 值 ， 有 时 它 是 指向 一 个 整 型 或 一 个 数据 结构 的 指针 。 


Pj: isastream 函 数 it 


有 时 需要 判断 一 个 描述 符 是 否 引用 一 个 流 。 这 与 调用 isatty 函 数 来 判断 一 个 描述 符 是 否 
引用 一 个 终端 设备 相 类 似 〈 见 18.9 节 )。Linux 和 Solaris 为 此 提供 了 isastream 函 数 。 


#include <stropts.h> 


int isastream(int filedes) ; 





返回 值 : 若 为 STREAMS 设 备 则 返回 1， 和 否则 返回 0 





与 isatty 类 似 ， 它 通常 是 用 一 个 只 对 STREAMS 设 备 才 有 效 的 ioct1 函 数 来 进行 测试 的 。 
程序 清单 14-7 是 该 函数 的 一 种 可 能 的 实现 。 它 使 用 I_CANPUT ioct1 来 测试 由 第 三 个 参数 说 明 
的 优先 级 波段 (本 实例 中 为 0) 是 否 可 写 。 如 果 该 ioct1 执 行 成 功 ， 则 它 对 所 涉及 的 流 并 未 作 
任何 改变 。 


程序 清单 14-7 检查 描述 符 是 否 引 用 STREAMS 设 备 


#include <stropts.h> 
#include <unistd.h> 
int 


isastream(int fd) 


return(ioctl(fd, I CANPUT, 0) != -1); 


} 
程序 清单 14-8 可 用 于 测试 此 函数 。 
程序 清单 14-8 测试 lsastream 函 数 


#include "apue.h" 
#include <fcntl.h> 


int 
main(int argc, char *argv[]) 
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int Teta; 


for (i = 1; i < argc; i++) { 
if ((fd = open(argv[il, O_RDONLY)) < 0) { 
err ret("$s: can’t open", argv[i]); 


continue; 
) 
if (isastream(fd) == 0) 

err ret("$s: not a stream", argv[i]); 
else 


err msg("$s: streams device", argv[i]); 


) 


exit(0); 


n —————————— É————— RáÓ—M € —9À 
在 Solaris 9 下 运行 此 程序 ， 得 到 很 多 由 ioct1 函 数 返回 的 出 错 信息 ; 


$ ./a.out /dev/tty /dev/fb /dev/null /etc/motd 
/dev/tty: streams device 

/dev/fb: not a stream: Invalid argument 

/dev/null: not a stream: No such device or address 
/etc/motd: not a stream: Inappropriate ioctl for device 


/dev/tty 在 Solaris 之 下 是 个 STREAMS 设 备 ， 这 与 我 们 所 期 望 的 一 致 。/dev/ fb 不 是 一 个 
STREAMS 设 备 ， 但 它 是 支持 其 他 ioct1 请 求 的 字符 特殊 文件 。 对 于 不 知道 这 种 ioct1 请 求 的 设 
备 ， 它 返回 EINVAL。/dev/null 是 一 种 不 支持 任何 ioct1 操 作 的 字符 特殊 文件 ， 所 以 ioctl 返 
回 ENODEV。 最 后 ，/etc/motd 是 一 个 普通 文件 ， 而 不 是 字符 特殊 文件 ， 所 以 返回 ENOTTY (这 
种 情况 下 的 经 典 返 回 值 )。 我 们 从 未 见 到 曾 期 望 的 出 错 信 息 ENOSTR (“Device is not a stream"), 


ENOTTY 的 原意 是 “Not a typewriter”， 它 是 个 历史 产物 ， 当 ioct1 企 图 对 并 不 引用 字符 特殊 设备 的 
描述 符 进 行 操作 时 ，UNIX 系 统 内 核 都 返回 ENOTTY。 在 Solaris 中 ， 该 消息 已 被 改 为 “Inappropriate ioctl 
for device.” , 


实例 


如 果 ioct1 的 参数 request 是 TI_LIST， 则 系统 返回 已 压 人 该 流 所 有 模块 的 名 字 ， 包 括 最 顶 
端的 驱动 程序 。( 指 明 最 顶端 的 原因 是 ， 在 多 路 转 接 驱动 程序 的 情况 下 ， 有 多 个 驱动 程序 。 
Rago [1993] 第 12 章 讨论 了 多 路 转 接 驱动 程序 的 细节 。) 其 第 三 个 参数 应 当 是 指向 str_1ist 结 
构 的 指针 。 

struct str list { 


int Sl nmods; /* number of entries in array */ 
struct str mlist  *sl modlist; /* ptr to first element of array */ 


E 


E 
应 将 s1_modlist 设 置 为 指向 str_mlist 结 构 数组 的 第 一 个 元 素 ， 将 s 1_nmods 设 置 为 该 数 
组 中 的 项 数 : 

struct str_mlist { 


char l name[FMNAMESZ41];  /* null terminated module name */ 
ys 


常量 FMNAMESzZ 在 头 文件 <sys/conf. h> 中 定义 ， 其 值 常 常 是 8。 1_name 的 实际 长 度 是 
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FMNAMESZ+1， 增 加 1 个 字 节 是 为 了 存放 null 终 止 符 。 

如 果 ioct1 的 第 三 个 参数 是 0， 则 该 函数 返回 值 是 模块 数 ， 而 不 是 模块 名 。 我 们 将 先 用 这 
种 ioct1 调 用 确定 模块 数 ， 然 后 再 分 配 所 要 求 的 str_mli st 结构 数 。 

程序 清单 14-9 例 示 了 I_LIST 操 作 。 由 ioct1 返 回 的 名 字 列 表 并 不 对 模块 和 驱动 程序 进行 区 分 ， 
但 是 考虑 到 该 列表 的 最 后 一 项 是 处 于 流 底部 的 驱动 程序 ， 所 以 在 打印 时 将 其 标明 为 驱动 程序 。 


程序 清单 14-9 列表 流 中 的 模块 名 


#include "apue.h" 
#include <fcntl.h> 
#include <stropts.h> 
#include <sys/conf.h> 


int 
main(int argc, char *argv[]) 


int : fd, i, nmods; 
struct str list list; 


if (argc !- 2) 
err quit ("usage: $s «pathname»", argv[0]); 


if ((fd = open(argv[1], O RDONLY)) « 0) 
err_sys("can’t open $s", argv[1]); 

if (isastream(fd) == 0) 
err quit("*s is not a stream", argví1]); 


/* 
* Fetch number of modules. 
*/ 
if ((nmods - ioctl(fd, I LIST, (void *) 0)) « O) 
err Sys("I LIST error for nmods"); 
printf ("#modules = %d\n", nmods); 


/* 
* Allocate storage for all the module names. 
*/ 
list.sl modlist = calloc(nmods, sizeof(struct str mlist)); 
if (list.sl modlist == NULL) 

err Sys("calloc error"); 
list.sl nmods = nmods; 


/* 
* Fetch the module names. 
*/ 
if (ioctl(fd, I LIST, &list) < 0) 
err Sys ("I LIST error for list"); 


/* 
* Print the names. 
*/ 
for (i = 1; i <= nmods; i++) 
printf(" $5: ts\n", (i == nmods) ? "driver" : "module", 
list.sl modlist-««-»1 name); 
exit(0); 


) 
为 了 弄 清楚 哪些 STREAMS 模 块 已 压 人 控制 终端 ， 我 们 以 网 络 登录 和 控制 台 登 录 两 种 方式 
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运行 程序 清单 14-9 所 示 程 序 ， 得 到 下 列 结果 : 


$ who 
sar console May 1 18:27 
sar pts/7 Jul 12 06:53 
$ ./a.out /dev/console 
#modules = 5 
module: redirmod 
module: ttcompat 
module: ldterm 
module: ptem 
driver: pts 
$ ./a.out ind 
#modules = 
module: bac 
module: ldterm 
module: ptem 
driver: pts 
在 这 两 种 情形 中 ，4 个 STREAMS 模 块 都 是 一 样 的 (ttcompat, ldterm, ptemfüpts), ， 唯 一 的 区 别 
是 控制 台 在 其 流 的 顶部 多 了 一 个 模块 ， 它 的 作用 是 帮助 虚 控制 台 重 定向 。 运 行 此 程序 的 计算 机 
在 控制 台 上 运行 了 一 个 窗口 系统 , 所 以 /dev/console 实 际 上 3 引用 的 是 伪 终 端 而 非 硬 连 线 设 备 。 
第 19 章 将 说 明 伪 终端 。 | 口 
4. 5 (write) 至 STREAMS 设 备 
在 表 14-4 中 可 以 看 到 写 至 STREAMS 设 备 产 生 一 个 M_DATA 消 息 。 一 般 情况 确实 如 此 ， 但 是 
也 还 有 一 些 细节 需要 考虑 。 首 先 ， 流 中 最 顶部 的 一 个 处 理 模 块 规定 了 可 顺 流 传送 的 最 小 、 最 大 
数据 包 长 度 《无 法 查询 该 模块 中 规定 的 这 些 值 )。 如 果 写 的 数据 长 度 超 过 最 大 值 ， 则 流 首 将 这 
一 数据 按 最 大 长 度 分 解 成 若干 数据 包 。 最 后 一 个 数据 包 的 长 度 可 能 不 到 最 大 值 。 
接着 要 考虑 的 是 ， 如 果 向 流 写 0 个 字 节 ， 又 将 如 何 呢 ?除非 流 引 用 管道 或 FIFO， 否 则 就 顺 
流 发 送 0 长 度 消 息 。 对 于 管道 和 FIFO， 为 与 以 前 版 本 兼容 ， 系 统 的 默认 处 理 方 式 是 忽略 0 长 度 
write。 可 以 用 ioct1 设 置 管道 和 FIFO 流 的 写 模式 ， 从 而 更 改 这 种 默认 处 理 方式 。 
5. 写 模 式 
可 以 用 两 个 ioct1 命 令 取 得 和 设置 一 个 流 的 写 模式 。 如 果 将 request 设 置 为 I_GWROPT， 第 
三 个 参数 设置 为 指向 一 个 整 型 变量 的 指针 ， 则 该 流 的 当前 写 模式 在 该 整 型 量 中 返回 。 如 果 将 
request 设 置 为 I_SWROPT， 第 三 个 参数 是 一 个 整 型 值 ， 则 其 值 成 为 该 流 新 的 写 模式 。 如 同 处 理 
文件 描述 符 标 志和 文件 状态 标志 ( 见 3.14 节 ) 一 样 ,总 是 应 当先 取 当 前 写 模式 值 ,然后 修改 它 ， 而 
不 只 是 将 写 模式 设置 为 某 个 绝对 值 〈 很 可 能 会 关闭 某 些 原来 打开 的 位 )。 
目前 ， 只 定义 了 两 个 写 模 式 值 。 
SNDZERO 对 管道 和 FIFO 的 0 长 度 write 会 造成 顺 流传 送 一 个 0 长 度 消息 。 按 系统 默认 ，0 
长 度 写 不 发 送 消 息 。 
SNDPIPE 在 流 上 已 出 错 后 ， 若 调用 write 或 putmsg， 则 向 调用 进程 发 送 SIGPIPE 
信号 
流 也 有 读 模式 ， 我 们 先 说 明 getmsg 和 getpmsg 函 数 ， 然 后 再 说 明 读 模式 。 
6. getmsg 和 getpmsg 函 数 
使 用 read、getmsg 或 getpmsg 函 数 从 流 首 读 STREAMS 消 息 。 
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#include <stropts.h> 


int getmsg (int filedes, struct strbuf *restrict ctlptr, 


struct strbuf *restrict dataptr, int *restrict flagptr) ; 


int getpmsg(int filedes, struct strbuf *restrict cliptr, 
struct strbuf *restrict dalapir, int *restrict bandptr, 
int *restrict flagptr); 





两 个 函数 返回 值 : 车 成 功 则 返回 非 负 值 ， 若 出 错 则 返回 -1 


注意 ，flagptr 和 lbandptr 是 指向 整 型 的 指针 。 在 调用 之 前 ， 这 两 个 指针 所 指向 的 整 型 单元 
中 应 设置 成 所 希望 的 消息 类 型 ， 在 返回 时 ， 此 整 型 量 设置 为 所 读 到 的 消息 的 类 型 。 

如 果 flagpitr 指 向 的 整 型 单元 的 值 是 9， 则 getmsg 返 回流 首 读 队 列 中 的 下 一 个 消息 。 如 果 下 
一 个 消息 是 高 优先 级 消息 ， 则 在 返回 时 ，flagptr 所 指向 的 整 型 单元 设置 为 RS_HIPRI。 如 果 希 
望 只 接收 高 优先 级 消息 ， 则 在 调用 ge tmsg 之 前 必须 将 fiagptr 所 指向 的 整 型 单元 设置 为 
RS_HIPRI, 

getpmsg 使 用 一 个 不 同 的 常量 集 。 为 了 只 接收 高 优先 级 消息 ， 我 们 可 将 fiagptr 指 向 的 整 型 
单元 设置 为 MSG_HIPRI。 为 了 只 接收 某 个 优先 级 波段 或 以 上 波段 (包括 高 优先 级 消息 ) 的 消 
息 ， 我 们 可 将 该 整 型 单元 设置 为 MSG_BAND ， 然 后 将 pardptr 指 向 的 整 型 单元 设置 为 该 波段 的 非 
0 优先 级 值 。 如 果 只 希望 接收 第 1 个 可 用 消息 ， 则 可 将 fagptr 指 向 的 整 型 单元 设置 为 MSG_ANY， 
在 返回 时 ， 该 整 型 值 将 改写 为 MSG_HIPRI 或 MSG_BRAND， 这 取决 于 接收 到 的 消息 的 类 型 。 如 果 
取 到 的 消息 并 非 高 优先 级 消息 ， 那 么 bandptr 指 向 的 整 型 将 包括 消息 的 优先 级 波段 值 。 

如 果 clptr 是 null， 或 ctliptr->maxlen 是 一 1， 那 么 消息 的 控制 部 分 仍 保留 在 流 首 读 队 列 中 ， 我 
们 将 不 处 理 它 。 类 似 地 ， 如 果 dataptr 是 null， 或 者 dataptr->maxlen 是 -1， 那 么 消息 的 数据 部 分 仍 
保留 在 流 首 读 队 列 中 ， 我 们 也 不 处 理 它 。 否 则 ， 将 按照 缓冲 区 的 容量 取 到 消息 中 尽 可 能 多 的 控 
制 和 数据 部 分 ， 余 下 部 分 仍 留 在 队 首 ， 等 待 下 次 取 用 。 

如 果 getmsg 和 getpmsg 调 用 取 到 一 消息 ， 那 么 返回 值 是 0。 如 果 消 息 控制 部 分 中 有 一 些 余 留 
在 流 首 读 队 列 中 ， 那 么 返回 常量 MORECTL。 类 似 地 ， 如 果 消 息 数据 中 有 一 些 余 留 在 流 首 读 队 列 
中 ， 那 么 返回 常量 MOREDATA。 如 果 控 制 和 数据 都 有 一 些 余 留 在 流 首 读 队 列 中 ， 那 么 返回 常量 
值 是 (MORECTLIMOREDATA), 

7. 读 模 式 

如 果 读 (read) STREAMS 设 备 会 发 生 些 什么 呢 ? 有 两 个 潜在 的 问题 : 

(1) 如 果 读 到 流 中 消息 的 记录 边界 将 会 怎样 ? 

(2) 如 果 调 用 read， 而 流 中 下 一 个 消息 有 控制 信息 又 将 如 何 ? 
对 第 一 种 情况 的 默认 处 理 模 式 称 为 字 节 流 模式 。read 从 流 中 取 数 据 直 至 满足 了 所 要 求 的 字 节 
数 ， 或 者 已 经 不 再 有 数据 。 在 这 种 模式 中 ， 名 略 流 中 消息 的 边界 。 对 第 二 种 情况 的 默认 处 理 是 ， 
如 果 在 队列 的 前 端 有 控制 消息 ， 则 zeada 出 错 返回 。 可 以 改变 这 两 种 默认 处 理 模式 。 

调用 ioct1 时 ， 若 将 reguest 设 置 为 T_GRDOPT， 第 三 个 参数 又 是 指向 一 个 整 型 单元 的 指针 ， 
则 对 该 流 的 当前 读 模 式 在 该 整 型 单元 中 返回 。 如 果 将 regwest 设 置 为 IT_SRDOPT， 第 三 个 参数 是 
整 型 值 ， 则 将 该 流 的 读 模 式 设置 为 该 值 。 读 模式 值 可 由 下 列 三 个 常量 指定 : 

RNORM 普通 ， 字 节 流 模式 ， 如 上 所 述 这 是 默认 模式 。 

RMSGN 消息 不 丢弃 模式 。read 从 流 中 取 数 据 直 至 读 到 所 要 求 的 字 节 数 ， 或 者 到 达 消 

息 边界 。 如 果 某 次 read 只 用 了 消息 的 一 部 分 ， 则 其 余下 部 分 仍 留 在 流 中 ， 以 
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供 下 一 次 读 。 
RMSGD 消息 丢弃 模式 。 这 与 不 丢弃 模式 的 区 别 是 ， 如 果菜 次 读 只 用 了 消息 的 一 部 分 ， 
则 余下 部 分 就 被 丢弃 ， 不 再 使 用 。 
在 读 模式 中 还 可 指定 另外 三 个 常量 ， 以 便 设置 在 读 到 流 中 包含 协议 控制 信息 的 消息 时 
read 的 处 理 方法 : 
RPROTNORM 协议 一 普通 模式 。read 出 错 返 回 ，errno 设 置 为 EBADMSG。 这 是 默认 模式 。 
RPROTDAT ”协议 -数据 模式 。read 将 控制 部 分 作为 数据 返回 给 调用 者 。 
RPROTDIS ”协议 -丢弃 模式 。read 丢 弃 消 息 中 的 控制 信息 ， 但 是 返回 消息 中 的 数据 。 
任 一 时 刻 ， 只 能 设置 一 种 消息 读 模 式 以 及 一 种 协议 读 模 式 。 默 认 读 模式 是 (RNORM 1 
RPROTNORM), 






2:3 


程序 清单 14-10 是 在 程序 清单 3-3 的 基础 上 改写 的 ， 它 用 getmsg 代 末了 read。 
程序 清单 14-10 用 getmsg 将 标准 输入 复制 到 标准 输出 


#include "apue.h" 
#include <stropts.h> 


#define BUFFSIZE 4096 


int 

main (void) 

{ 
int n, flag; 
char ctlbuf [BUFFSIZE], datbuf [BUFFSIZE] ; 
struct strbuf ctl, dat; 


ctl. buf = ctlbuf; 
ctl.maxlen = BUFFSIZE; 
dat.buf = datbuf; 
dat.maxlen = BUFFSIZE; 
for (;;) f 

flag - 0; /* return any message */ 

if ((n = getmsg(STDIN FILENO, &ctl, &dat, &flag)) « 0) 

err Ssys("getmsg error"); 
fprintf(stderr, "flag = $d, ctl.len = %d, dat.len = %d\n", 
flag, ctl.len, dat.len); 
if (dat.len == 0) 


exit (0); 
else if (dat.len > 0) 
if (write (STDOUT_FILENO, dat.buf, dat.len) != dat.len) 


err_sys ("write error"); 





} 
如 果 在 Solaris (其 管道 和 终端 都 是 用 STREAMS 实 现 的 ) 下 运行 此 程序 则 得 : 
$ echo hello, world | ./a.out 要 求 基于 STREAMS 的 管道 


flag = 0, ctl.len = -1, dat.len = 13 

hello, world . 

flag = 0, ctl.len = 0, dat.len = 0 表明 STREAMS 挂 断 

$ ./a.out 要 求 基于 STREAMS 的 终端 
this is line 1 

flag = 0, ctl.len = -1, dat.len = 15 
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this is line 1 

and line 2 

flag = 0, ctl.len = -1, dat.len = 11 
and line 2 


D 键入 终端 EOF 字 符 

flag = 0, ctl.len = -1, dat.len = 0 tty 文 件 结 是 与 挂 断 不 相同 

$ ./a.out < /etc/motd 

getmsg error: Not a stream device 
当 管道 被 关闭 时 〈 当 echo 终 止 时 ) ， 它 对 程序 清单 14-10 表 现 为 一 个 STREAMS 挂 断 ， 控 制 长 度 
和 数据 长 度 都 设置 为 0。(15.2 节 将 讨论 管道 .) 但 是 对 于 终端 ， 键 人 文件 结束 字符 只 使 返回 的 数 
据 长 度 为 0。 这 与 STREAMS 挂 断 并 不 相同 。 如 所 预料 的 一 样 ， 将 标准 输入 重新 定向 到 一 个 非 
STREAMS 设 备 ，getmsg 出 错 返回 。 口 


14.5 MO 多 路 转 接 
当 从 一 个 描述 符 读 ， 然 后 又 写 到 另 一 个 描述 符 时 ， 可 以 在 下 列 形 式 的 循环 中 使 用 阻塞 IO; 


while ((n = read(STDIN FILENO, buf, BUFSIZ)) > 0) 
if (write(STDOUT FILENO, buf, n) != n) 
err 8ys("write error"); 


这 种 形式 的 阻塞 /O 到 处 可 见 。 但 是 如 果 必 须 从 两 个 描述 符 读 ， 又 将 如 何 呢 ? 如 果 仍 旧 使 用 阻塞 
IO， 那 么 就 可 能 长 时 间 阻 塞 在 一 个 描述 符 上 ， 而 另 一 个 描述 符 虽 有 很 多 数据 却 不 能 得 到 及 时 处 
理 。 所 以 为 了 处 理 这 种 情况 显然 需要 另 一 种 不 同 的 技术 。 

让 我 们 观察 telnet(1) 命 令 的 结构 。 访 程序 读 终 端 (标准 输 入 )， 将 所 得 数据 写 到 网 络 连接 
E, 同时 读 网 络 连接 ， 将 所 得 数据 写 到 终端 上 (标准 输出 )。 在 网 络 连 接 的 另 一 端 ，telneta 
守护 进程 读 用 户 在 终端 上 所 键 人 的 内 容 ， 并 将 其 送 给 shell， 这 如 同 用 户 登 录 在 远程 机 器 上 一 样 。 
telnetd 守 护 进程 将 执行 用 户 键 人 命令 ， 而 产生 的 输出 通过 elnet 命 令 送 回 给 用 户 ， 并 显示 
在 用 户 终端 上 。 图 14-6 显 示 这 种 工作 情景 。 


终端 telnet 守护 
用 户 命令 进程 


图 14-6 telnet 程 序 概观 


telnet 进 程 有 两 个 输入 、 两 个 输出 。 对 这 两 个 输入 中 的 任 一 个 都 不 能 使 用 阻塞 read， 因 
为 我 们 永远 不 知道 哪 一 个 输入 有 我 们 需要 的 数据 。 

处 理 这 种 特殊 问题 的 一 种 方法 是 ， 用 fork 将 一 个 进程 变 成 两 个 进程 ， 每 个 进程 处 理 一 条 数 
据 通 路 。 图 14-7 中 显示 了 这 种 安排 。( 系 统 V uucp 通 信和 包 提 供 了 cu(1) 命 令 ， 其 结构 与 此 相似 ,) 


telnetd 命 令 
( 父 进程 ) 
telnetd 
用 户 守护 进程 
telnetdáp4 
( 子 进程 ) 


图 14-7 使 用 两 个 进程 实现 telnet 程 序 
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如 有 果 使 用 两 个 进程 ， 则 可 使 每 个 进程 都 执行 阻塞 read。 但 是 这 也 产生 了 问题 ， 操作 什么 时 候 终 
IE? 如 果子 进程 接收 到 文件 结束 符 telnetd 守 护 进程 使 网 络 连接 斯 开 ， 那 么 该 子 进 程 终 止 ， 然 后 父 
进程 接收 到 SIGCHLD 信 号 。 但 是 ， 如 若 父 进程 终止 (用 户 在 终端 上 键 人 了 文件 结束 符 )， 那 么 父 
进程 应 通知 子 进 程 停止 。 为 此 可 以 使 用 一 个 信号 (例如 SIGUSR1)， 但 这 使 程序 变 得 更 加 复杂 。 

我 们 可 以 不 使 用 两 个 进程 ， 而 是 用 一 个 进程 中 的 两 个 线程 。 这 避免 了 终止 的 复杂 性 ， 但 却 
要 求 处 理 线程 之 间 的 同步 ， 在 减少 复杂 性 方面 这 可 能 会 是 得 不 偿 失 。 

另 一 个 方法 是 仍旧 使 用 一 个 进程 执行 该 程序 ， 但 使 用 非 阻 塞 VO 读 取 数 据 。 基 本 方法 是 将 两 
个 输入 描述 符 都 设置 为 非 阻塞 的 ， 对 第 一 个 描述 符 发 一 个 read。 如 果 该 输入 上 有 数据 ， 则 读 
数据 并 处 理 它 ， 如 果 无 数据 可 读 ， 则 read 立 即 返 回 。 然 后 对 第 二 个 描述 符 作 同样 的 处 理 。 在 
此 之 后 ， 等 待 若干 种， 然后 再 读 第 一 个 描述 符 。 这 种 形式 的 循环 称 为 轮 询 (polling)。 这 种 方 
法 的 不 足 之 处 是 浪费 CPU 时 间 。 因 为 大 多 数 时 间 实 际 上 是 无 数据 可 读 的 ， 但 是 仍 花费 时 间 不 断 
反复 执行 read 系统 调用 。 在 每 次 循环 后 要 等 多 长 时 间 再 执行 下 一 轮 循环 也 很 难 确定 。 虽 然 轮 
询 技术 在 支持 非 阻 塞 VO 的 系统 上 都 可 使 用 ， 但 是 在 多 任务 系统 中 应 当 避 免 使 用 这 种 方法 。 

还 有 一 种 技术 称 之 为 异步 WO (asynchronous WO)。 其 基本 思想 是 进程 告诉 内 核 ， 当 一 个 描 
述 符 已 准备 好 可 以 进行 WO 时 ， 用 一 个 信号 通知 它 。 这 种 技术 有 两 个 问题 。 第 一 ， 并 非 所 有 系统 
都 支持 这 种 机 制 (在 Single UNIX Specification 中 这 是 一 个 可 选择 的 设施 )。 系 统 V 为 此 技术 提供 
了 SIGPOLL 信 号 ,但 是 仅 当 措 述 符 引 用 STREAMS 设 备 时 ， 此 信号 才能 工作 。BSD 有 一 个 类 似 
的 信号 sITGIO, 但 也 有 类 似 的 限制 ， 仅 当 找 述 符 引 用 终端 设备 或 网 络 时 才能 工作 。 其 次 ， 这 种 
言 号 对 每 个 进程 而 言 只 有 1 个 (SIGPOLL 或 SIGIO)。 如 果 使 该 信号 对 两 个 描述 符 都 起 作用 (在 
我 们 正在 讨论 的 实例 中 ， 从 两 个 描述 符 读 )， 那 么 在 接 到 此 信号 时 进程 无 法 判别 是 哪 一 个 描述 
符 已 准备 好 可 以 进行 JO。 为 了 确定 是 哪 一 个 ， 仍 需 将 这 两 个 描述 符 都 设置 为 非 阻塞 的 ， 并 顺序 
试 执行 WO。14.6 节 将 简要 说 明 异 步 /O。 

一 种 比较 好 的 技术 是 使 用 VO 多 路 转 接 (UO multiplexing)。 先 构造 一 张 有 关 描 述 符 的 列表 ， 
然后 调用 一 个 函数 ， 直 到 这 些 描述 符 中 的 一 个 已 准备 好 进行 WO 时 ， 该 函数 才 返 回 。 在 返回 时 ， 
它 告诉 进程 哪些 描述 符 已 准备 好 可 以 进行 WO。 

poll、pselect 和 select 这 三 个 函数 使 我 们 能 够 执行 /O 多 路 转 接 。 表 14-5 摘 要 列 出 了 
哪些 平台 支持 这 些 函 数 。 注 意 基 本 POSIX.1 标 准 定义 了 select 函 数 ， 而 pol1 则 是 对 该 基本 部 
分 的 XSI 扩 展 。 


表 14-5 多 种 UNIX 系 统 支持 的 VO 多 路 转 接 


FreeBSD 5.2.1 


Linux 2.4.22 
Mac OS X 10.3 
Solaris 9 





POSIX 指 定 ， 为 了 在 程序 中 使 用 select， 必 须 包 括 <sys/select.h>。 但 是 历史 上 ， 为 了 在 程序 
中 使 用 select ， 还 要 包括 另外 三 个 头 文件 ， 而 且 某 些 实现 至 今 还 落 在 标准 之 后 。 为 此 ， 要 查看 select 
手册 页 ， 弄 清楚 你 所 用 的 系统 对 它 支持 到 何 种 程度 . 较 老 的 系统 要 求 在 程序 中 包括 <Sys/types.h>、 


<sys/time.h>4e<unistd.h>, 
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LO 多 路 转 接 在 4.2 BSD AR select HKLM, LRAHKELMFARVONABUO, LT 
对 其 他 描述 符 同 样 是 起 作用 的 。SVR3 在 增加 STREAMS 机 制 时 增加 了 pol1 函 数 ， 但 一 开始 pol1 只 对 
STREAMS 设 备 起 作用 。SVR4 支 持 对 任 一 描述 竺 起 作用 的 Pol1l。 


14.5.1 select#lpselect mH 


在 所 有 依从 POSIX 的 平台 上 ，select 函 数 使 我 们 可 以 执行 WO 多 路 转 接 。 传 向 select 的 
参数 告诉 内 核 : 

。 我 们 所 关心 的 描述 符 。 

。 对 于 每 个 描述 符 我 们 所 关心 的 状态 。( 是 否 读 一 个 给 定 的 描述 符 ? 是 否 想 写 一 个 给 定 的 描 

述 符 ? 是 否 关心 一 个 描述 符 的 异常 状态 ? ) 

。 愿 意 等 待 多 长 时 间 (可 以 永远 等 待 ， 等 待 一 个 固定 量 时 间 ， 或 完全 不 等 待 )。 
人 了 从 select 返 回 时 ， 内 核 告诉 我 们 : 

。 已 准备 好 的 描述 符 的 数量 。 

。 对 于 读 、 写 或 异常 这 三 个 状态 中 的 每 一 个 ， 哪 些 描述 符 已 准备 好 。 

使 用 这 些 返 回信 息 ， 就 可 调用 相应 的 VO 函数 (一般 是 read 或 write)， 并 且 确 知 该 函数 不 
会 阻塞 。 


#include <sys/select.h> 


int select (int maxfdpl, fd set *restrict readfds, 


fd set *restrict writefds, fd set *restrict exceptfds, 
struct timeval *restrict tuptr); 


返回 值 : 准备 就 绪 的 描述 符 数 ， 若 超时 则 返回 0， 若 出 错 则 返回 一 ! 





先 说 明 最 后 一 个 参数 ， 它 指定 愿意 等 待 的 时 间 : 


struct timeval { 
long tv_sec; /* seconds */ 
long tv_usec; /* and microseconds */ 


有 三 种 情况 : 

tvptr==NULL 
永远 等 待 。 如 果 捕 捉 到 一 个 信号 则 中 新 此 无 限期 等 待 。 当 所 指定 的 描述 符 中 的 一 个 已 
准备 好 或 捕捉 到 一 个 信号 则 返回 。 如 果 捕 捉 到 一 个 信号 ， 则 select 返 回 -1，errno 
设置 为 EINTR。 

tvptr—>tv_sec==0 && tvptr—>tv_usec==0 
完全 不 等 待 。 测 试 所 有 指定 的 描述 符 并 立即 返回 。 这 是 得 到 多 个 描述 符 的 状态 而 不 阻 
寒 select 函 数 的 轮 询 方法 。 

tvptr~>tv_sec !-0 | | tvptr->tv_usec!=0 
等 待 指定 的 秒 数 和 微 秒 数 。 当 指定 的 描述 符 之 一 已 准备 好 ， 或 当 指定 的 时 间 值 已 经 超 
过 时 立即 返回 。 如 果 在 超时 时 还 没有 一 个 描述 符 准 备 好 ， 则 返回 值 是 0 (如 果 系 统 不 
提供 微 秒 分 辩 率 ， 则 mprtr->t_wsec 值 取 整 到 最 近 的 支持 值 )。 与 第 一 种 情况 一 样 ， 这 种 
等 待 可 被 捕捉 到 的 信号 中 斯 。 
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POSIX.1 刀 许 在 实现 中 修改 timeval 结 构 中 的 值 ， 所 以 在 select 返 回 后 ， 你 不 能 指望 该 结构 仍旧 
保持 调用 select 之 前 它 所 包含 的 值 。FreeBSD 5.2.1, Mac OS X 10.3 和 Solaris 9 都 保持 该 结构 中 的 值 不 
变 。 但 是 Linux 2.4.22 中 ， 著 在 该 时 间 值 尚未 超过 时 select 就 返回 ， 那 么 将 用 余 留 时 间 值 更 新 该 结构 。 


中 间 三 个 参数 readfds、writefds 和 exceptfds 是 指向 描述 罕 集 的 指针 。 这 三 个 描述 符 集 说 明了 
我 们 关心 的 可 读 、 可 写 或 处 于 异常 条 件 的 各 个 描述 符 。 每 个 描述 符 集 存放 在 一 个 fd_set 数 据 
类 型 中 。 这 种 数据 类 型 为 每 一 可 能 的 描述 符 保持 了 一 位 ， 其 实现 可 如 图 14-8 中 所 示 。 


fa0 fd]! fd2 


z 
readfds — » | 0 0 0 | ane 
E 


一 一 一 ”每 个 可 能 的 描述 符 占 ! 位 。 —— — 


writefds  — | o 0 0 ER 


he — ——— fd set 数据 类 型 ”一 一 一 一 | 
-一 
exceptfds — | o 0 0 | are | 
图 14-8 对 select 指 定 读 、 写 和 异常 条 件 描述 符 


对 fdq_set 数 据 类 型 可 以 进行 的 处 理 是 : 分 配 一 个 这 种 类 型 的 变量 ， 将 这 种 类 型 的 一 个 变 
量 值 赋予 同类 型 的 另 一 个 变量 ,或 对 于 这 种 类 型 的 变量 使 用 下 列 四 个 函数 中 的 一 个 。 




















#include <sys/select.h> 


int FD ISSET(int fd, fd set *fdset) ; 


返回 值 : Hfd HRE Sep MG ARO, AUE E0 


void FD CLR(int fd, fd set *fdset); 
void FD SET(int fd, fd set *fdset); 
void FD ZERO(fd set *fdset); 





这 些 接口 可 实现 为 宏 或 函数 。 调 用 FD_ZERO 将 一 个 指定 的 fd_set 变 量 的 所 有 位 设置 为 0。 
调用 FD_SET 设 置 一 个 fd_set 变 量 的 指定 位 。 调 用 FD_CLR 则 将 一 指定 位 清除 。 最 后 ， 调 用 
FD_ISSET 测 试 一 指定 位 是 否 设置 。 

声明 了 一 个 描述 符 集 后 ， 必 须 用 FD_ZERO 清 除 其 所 有 位 ， 然 后 在 其 中 设置 我 们 关心 的 各 个 
位 。 这 种 操作 序列 如 下 所 示 : 


fd set rset; 
int fd; 


FD ZERO(&rset); 
FD SET(fd, &rset); 
FD SET (STDIN FILENO, &rset); 
从 select 返 回 时 ， 用 FD_ISSET 而 试 该 集中 的 -一 个 给 定位 是 否 仍旧 设置 


if (FD_ISSET(fd, &rset)) { 


416 ] 
select 的 中 间 三 个 参数 (指向 描述 符 集 的 指针 ) 中 的 任意 一 个 或 全 部 都 可 以 是 空 指针 ， 
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这 表示 对 相应 状态 并 不 关心 。 如 果 所 有 三 个 指针 都 是 空 指针 ， 则 select 提 供 了 较 sleep 更 精 
确 的 计时 器 。( 回 忆 10.19 节 ，sleep 等 待 整数 秒 ， 而 对 于 select， 其 等 待 的 时 间 可 以 小 于 1s， 
其 实际 分 辩 率 取决 于 系统 时 钟 。) 习题 14.6 给 出 了 这 样 一 个 函数 。 

select 的 第 一 个 参数 maxfdp1 的 意思 是 “最 大 描述 符 加 1”。 在 三 个 描述 符 集 中 找 出 最 大 描 
述 符 编 号 值 ， 然 后 加 1， 这 就 是 第 一 个 参数 值 。 也 可 将 第 一 个 参数 设置 为 FD_SETSIZE， 这 是 
<sys/select.h> 中 的 一 个 常量 ， 它 说 明了 最 大 的 描述 符 数 (经常 是 1 024)。 但 是 对 大 多 数 应 
用 程序 而 言 ， 此 值 太 大 了 ， 多 数 应 用 程序 只 使 用 3~10 个 描述 符 。( 某 些 应 用 程序 使 用 更 多 的 摘 
述 符 ,但 这 种 UNIX 程 序 并 不 具 代 表 性 。) 如 果 将 第 三 个 参数 设置 为 我 们 所 关注 的 最 大 描述 符 编 
号 值 加 1， 内 核 就 只 需 在 此 范围 内 寻找 打开 的 位 ， 而 不 必 在 三 个 描述 符 集中 的 数 百 位 内 搜索 。 

例如 ， 若 编写 下 列 代码 : 

fd set readset, writeset; 


FD ZERO(&readset); 

FD ZERO(&writeset); 

FD SET(0, &readset); 

FD SET(3, &readset); 

FD SET(1, &writeset); 

FD SET(2, &writeset); 

select(4, &readset, &writeset, NULL, NULL); 


那么 ， 图 14-9 显 示 了 这 两 个 描述 符 集 的 情况 。 


fd0 fd1 fd2 fd3 


vm. 
LER 


writeset: 





maxfdpl = 4 
图 14-9 select 的 示例 描述 符 集 


因为 描述 符 编 号 从 0 开始 ， 所 以 要 在 最 大 描述 符 编号 值 上 加 1。 第 一 个 参数 实际 上 是 要 检查 
的 描述 符 数 (从 描述 符 0 开 始 )。 

select 有 三 个 可 能 的 返回 值 。 

(1) 返回 值 ~1 表 示 出 错 。 出 错 是 有 可 能 的 ， 例 如 在 所 指定 的 描述 符 都 没有 准备 好 时 捕捉 到 
一 个 信号 。 在 此 种 情况 下 ， 将 不 修改 其 中 任何 描述 符 集 。 

(2) 返回 值 0 表 示 没 有 描述 符 准备 好 。 若 指定 的 描述 符 都 没有 准备 好 ， 而 且 指 定 的 时 间 已 经 
超过 ， 则 发 生 这 种 情况 。 此 时 ， 所 有 描述 符 集 皆 被 清 0。 

(3) 正 返 回 值 表示 已 经 准备 好 的 描述 符 数 ， 该 值 是 三 个 描述 符 集中 已 准备 好 的 描述 符 数 之 
和 ， 所 以 如 果 同 一 描述 符 已 准备 好 读 和 写 ， 那 么 在 返回 值 中 将 其 计 为 2。 在 这 种 情况 下 ， 三 个 
描述 符 集 中 仍旧 打开 的 位 对 应 于 已 准备 好 的 描述 符 。 

对 于 “准备 好 ”的 意思 要 作 一 些 更 具体 的 说 明 : 

。 若 对 读 集 (readfds) 中 的 一 个 描述 符 的 read 操 作 将 不 会 阻塞 ， 则 此 描述 符 是 准备 好 的 。 

。 若 对 写 集 (writefds) 中 的 一 个 描述 符 的 write 操作 将 不 会 阻塞 ， 则 此 描述 符 是 准备 好 的 。 

。 若 异常 状态 集 (exceptfds) 中 的 一 个 描述 符 有 一 个 未 决 异常 状态 , 则 此 描述 符 是 准备 好 的 。 
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现在 ， 异 常 状态 包括 (a) 在 网 络 连接 上 到 达 的 带 外 数据 ， 或 者 (b) 在 处 于 数据 包 模 式 的 擅 终 

端 上 发 生 了 某 些 状 态 。(Stevens[1990] 的 15.10 节 中 说 明了 后 一 种 状态 。) 

。 对 于 读 、 写 和 异常 状态 ， 普 通 文件 描述 符 总 是 返回 准备 好 。 

应 当 理 解 ， 一 个 描述 符 阻塞 与 否 并 不 影响 select 是 否 阻塞 。 也 就 是 说 ， 如 果 希 望 读 一 个 非 阻 
塞 描述 符 ， 并 且 以 超时 值 为 5s 调 用 select， 则 select 最 多 阻塞 5s。 相 类 似 地 ， 如 果 指 定 一 个 
无 限 的 超时 值 ， 则 在 该 描述 符 数据 准备 好 或 捕捉 到 一 个 信号 之 前 ，select 一 直 阻 塞 。 

如 果 在 一 个 描述 符 上 磁 到 了 文件 结尾 处 ， 则 select 认 为 该 描述 符 是 可 读 的 。 然 后 调用 
read， 它 返回 0， 这 是 UNIX 系 统 指示 到 达 文 件 结尾 处 的 方法 。( 很 多 人 错误 地 认为 ， 当 到 达 文 
件 结尾 处 时 ，select 会 指示 一 个 异常 状态 。) 

POSIX.1 也 定义 了 一 个 select 的 变 体 ， 它 被 称 为 pselect。 


#include «sys/select.h» 


int pselect (int maxfdpl, £d set *restrict readfds, 
fd set *restrict writefds, £d set *restrict exceptfds, 


const struct timespec *restrict fspir, 
const sigset t *restrict sigmask) ; 


返回 值 : 准备 就 绪 的 描述 符 数 ， 若 超时 则 返回 0， 若 出 错 则 返回 -1 





除 下 列 几 点 外 ，pselect 与 select 相 同 ; 

。select 的 超时 值 用 timeval 结 构 指定 ， 但 pselect 使 用 timespec 结 构 。( 回 忆 11.6 节 
中 timespec 结 构 的 定义 。) timespec 结 构 以 秒 和 纳 秒表 示 超 时 值 ， 而 非 秒 和 微 秒 。 如 
果 平 台 支 持 这 样 精细 的 粒度 ， 那 么 timespec 就 提供 了 更 精准 的 超时 时 间 。 

。pselect 的 超时 值 被 声明 为 const， 这 保证 了 调用 pselect 不 会 改变 此 值 。 

* 对 于 pselect 可 使 用 一 可 选择 的 信号 屏 项 字 。 若 sigmask 为 空 ， 那么 在 与 信号 有 关 的 方面 ， 
pselect 的 运行 状况 和 se1lect 相 同 。 否 则 ，sigmask 指 向 一 信号 屏蔽 字 ， 在 调用 
pselect 时 ， 以 原子 操作 的 方式 安装 该 信号 屏蔽 字 。 在 返回 时 恢复 以 前 的 信号 屏蔽 字 。 


14.5.2 polli 


pol1 函 数 类 似 于 select， 但 是 其 程序 员 接 口 则 有 所 不 同 。 我 们 将 会 看 到 ， 虽 然 pol1l 函 
数 可 用 于 任何 类 型 的 文件 描述 符 ， 但 它 起 源 于 系统 V， 所 以 po11 与 STREAMS 系 统 紧 紧 相关 。 


#include <poll.h> 


int poll(struct polifd fdarray{], nfds_t nfds, int timeout); 


返回 值 : 准备 就 绪 的 描述 符 数 ， 若 超时 则 返回 0， 若 出 错 则 返回 -1! 





与 select 不 同 ，po1l1 不 是 为 每 个 状态 (可 读 性 、 可 写 性 和 异常 状态 ) 构造 一 个 描述 符 集 ， 而 
是 构造 一 个 pol1fd 结 构 数 组 ， 每 个 数组 元 素 指定 一 个 描述 符 编号 以 及 对 其 所 关心 的 状态 。 
struct pollfd { 
int fd; /* file descriptor to check, or <0 to ignore */ 
short events; /* events of interest on fd */ 


short revents; /* events that occurred on fd */ 


}; 
fdarray 数 组 中 的 元 素数 由 nfds 说 明 。 
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由 于 历史 原因 ，、 上 声明 nfds 和 参数 有 几 种 不 同 的 方式 。SVR3 说 明 nfds 的 类 型 为 unsigned long， 这 似 
乎 是 术 大 了 。 在 SVR4 手 册 [AT&T 1990d] 中 ，poll 原 型 的 第 二 个 参数 的 数据 类 型 为 size_t (LA2-16 
中 的 基本 系统 数据 类 型 )。 但 在 <poll.h> 包 含 的 实际 原型 中 ， 第 二 个 参数 的 数据 类 型 仍 说 明 为 
unsigned long, Single UNIX Specification 定 义 了 新 类 型 nfds_t， 该 类 型 允许 实现 选择 对 其 合适 的 类 
型 并 且 隐 藏 了 应 用 细节 。 注 意 ， 因 为 返回 值 表示 数组 中 满足 事件 (events) 的 项 数 ， 所 以 这 种 类 型 必须 
大 得 足以 保持 一 个 整 型 。 

SVR4 的 SVID[AT&T1989] 说 明 poll 的 第 一 个 参数 是 struct pollfd fdarray[ ]， 而 SVR4 手 册页 
[AT&T 1990 d] 则 说 明 该 参数 为 struct pollfd *fdarray。 在 C 语 言 中 ， 这 两 种 说 明 是 等 价 的 。 我们 使 
用 第 一 种 说 明 以 重申 jarray 指 向 一 个 结构 数组 ， 而 不 是 指向 单个 结构 的 指针 。 


应 将 每 个 数组 元 素 的 events 成 员 设 置 为 表 14-6 中 所 示 的 值 。 通 过 这 些 值 告诉 内 核 我 们 对 
该 描述 符 关心 的 是 什么 。 返 回 时 ， 内 核 设置 revents 成 员 ， 以 说 明 对 于 该 描述 符 已 经 发 生 了 什 
么 事件 。( 注 意 ，poll 没 有 更 改 events 成 员 ， 这 与 select 不 同 ，select 修 改 其 参数 以 指示 
哪 一 个 描述 符 已 准备 好 了 。) 


表 14-6 poll 的 events 和 revents 标 志 


输入 至 | 从 revents 
events?| 得 到 结果 ? 


POLLIN 不 阻塞 地 可 读 除 高 优先 级 外 的 数据 (等 效 于 POLLRDNORM| POLLRDBAND) 
POLLRDNORM 不 阻塞 地 可 读 普通 数据 (优先 级 波段 为 0) 

POLLRDBAND 不 阻塞 地 可 读 非 0 优先 级 波段 数据 

POLLPRI 不 阻塞 地 可 读 高 优先 级 数据 


POLLOUT . 不 阻塞 地 可 和 写 普 通 数据 
POLLWRNORM . 与 POLLOUT 相 同 

POLLWRBAND 不 阴 塞 地 可 写 非 0 优 先 级 波段 数据 
POLLERR . 已 出 错 

POLLHUP . 已 挂 断 

POLLNVAL . 描述 符 不 引用 -- 打 开 文 件 














表 14-6 中 头 四 行 测 试 可 读 性 ， 接 着 三 行 测试 可 写 性 ， 最 后 三 行 则 是 测试 异常 状态 。 最 后 三 
行 是 由 内 核 在 返回 时 设置 的 。 即 使 在 events 字 段 中 没有 指定 这 三 个 值 ， 如 果 相 应 条 件 发 生 ， 
则 在 revents 中 也 返回 它们 。 

当 一 个 描述 符 被 挂 断 (POLLHUP) 后 ， 就 不 能 再 写 向 该 描述 符 。 但 是 仍 可 能 从 该 描述 符 读 
取 到 数据 。 

pol1 的 最 后 一 个 参数 说 明 我 们 愿意 等 待 多 少时 间 。 如 同 select 一 样 ， 有 三 种 不 同 的 情形 : 

timeout == -1 永远 等 待 。( 某 些 系统 在 <stropts .h> 中 定义 了 常量 INFTIM， 其 值 通常 

是 -1。) 当 所 指定 的 描述 符 中 的 一 个 已 准备 好 ， 或 捕捉 到 一 个 信号 时 则 返 
回 。 如 果 捕 捉 到 一 个 信号 ， 则 poll 返 回 -1，errno 设 置 为 EINTR。 
timeout == 不 等 待 。 测 试 所 有 描述 符 并 立即 返回 。 这 是 得 到 很 多 个 描述 符 的 状态 而 
不 阻塞 pol1 函 数 的 轮 询 方 法 。 
timeout > 0 等 待 1imeorr 毫 秒 。 当 指定 的 描述 符 之 一 已 准备 好 ， 或 指定 的 时 间 值 已 超 
过 时 立即 返回 。 如 果 已 超时 但 是 还 没有 一 个 描述 符 准 备 好 ， 则 返回 值 是 0。 
(如 果 系 统 不 提供 毫秒 分 辩 率 ， 则 tarzeorzx 值 取 整 到 最 近 的 支持 值 。) 
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应 当 理 解 文件 结束 与 挂 断 之 间 的 区 别 。 如 果 正 从 终端 输入 数据 ， 并 键入 文件 结束 字符 ， 
FOLLIN 被 打开 ， 于 是 就 可 读 文件 结束 指示 (reaG 返 回 0)。POLLHUP 在 revents 中 没有 打开 。 
如 果 正 在 读 调制 解 调 器 ， 并 且 电 话 线 已 挂 断 ， 则 在 revents 中 将 接 到 POLLHUP 通 知 。 

与 select 一 样 ， 不 论 一 个 描述 符 是 否 阻塞 ， 都 不 影响 po11 是 否 阻塞 。 

select 和 poll 的 可 中 断 性 

中 断 的 系统 调用 的 自动 再 启动 是 由 4.2BSD 引 进 的 ( 见 10.5 节 )， 但 当时 select 函 数 是 不 再 
启动 的 。 这 种 特性 在 大 多 数 系统 中 一 直 延 续 了 下 来 ， 即 使 指定 了 SA_RESTART 也 是 如 此 。 但 是 ， 
在 SVR4 之 下 ， 如 果 指 定 了 SA_RESTART， 那 么 select 和 poll 也 是 自动 再 启动 的 。 为 了 在 将 
软件 移植 到 SVR4 派 生 的 系统 上 时 防止 这 一 点 ， 如 果 信 号 可 能 中 断 对 select 或 pol1 的 调用 ， 
则 总 是 使 用 signal_intr 函 数 ( 见 程序 清单 10-13) 。 


本 书 说 明 的 各 种 实现 在 接 到 一 信号 时 都 不 重启 动 poll 和 select， 即 便 使 用 了 SA_RESTART 标 志 也 
是 如 此 。 


14.6 异步 |/O 


使 用 上 一 节 说 明 的 select 和 poll 可 以 实现 异步 形式 的 通知 。 关 于 描述 符 的 状态 ,系统 并 不 
主动 告诉 我 们 任何 信息 ,我 们 需要 进行 查询 (调用 select 或 po11)。 如 在 第 10 章 中 所 述 ， 信 号 
机 构 提 供 一 种 以 异步 形式 通知 某 种 事件 已 发 生 的 方法 。 由 BSD 和 系统 V 派 生 的 所 有 系统 提供 了 
使 用 一 个 信号 (在 系统 V 中 是 SIGPOLL， 在 BSD 中 是 SIGIO) 的 异步 1O 方 法 ， 该 信号 通知 进程 
某 个 描述 符 已 经 发 生 了 所 关心 的 某 个 事件 。 


我 们 已 了 解 到 select 和 poll 对 任意 描述 符 都 能 工作 。 但 是 关于 异步 JO 却 有 限制 。 在 系统 V 派 生 
REP, HPUOR 对 STREAMS 设 备 和 STREAMS 管 道 起 作用 。 在 BSD 派 生 的 系 AF., AIIP 对 
终端 和 网 络 起 作用 。 


异步 JO 的 一 个 限制 是 每 个 进程 只 有 一 个 信号 。 如 果 要 对 几 个 描述 符 进行 异步 0 ， 那 么 在 
进程 接收 到 该 信号 时 并 不 知道 这 一 信号 对 应 于 哪 一 个 描述 符 。 


Single UNIX Specification 包 括 一 个 可 选择 的 通用 异步 JO 机 制 ， 这 取 自 实时 草案 标准 。 它 与 本 节 所 
说 明 的 机 制 无 关 。 该 机 制 解决 了 老 的 异步 JO 机 制 奉 在 的 很 多 限制 问题 ， 但 在 此 处 不 作 进一步 讨论 。 


14.6.1 系统 V 异 步 VO 


在 系统 V 中 ， 异 步 JO 是 STREAMS 系 统 的 一 部 分 。 它 只 对 STREAMS 设 备 和 STREAMS 管 道 
起 作用 。 系 统 V 的 异步 WO 信号 是 SIGPOLL。 

为 了 对 一 个 STREAMS 设 备 启动 异步 JO ， 需 要 调用 ioct1 ， 它 的 第 二 个 参数 (request) 
是 I_SETSIG。 第 三 个 参数 是 由 表 14-7 中 的 常量 构成 的 整 型 值 。 这 些 常 量 在 <stropts.h> 中 
定义 。 

表 14-7 中 “已 到 达 ” 的 意思 是 “已 到 达 流 首 的 读 队 列 ”。 

除了 调用 ioct1l 说 明 产生 sIGPOLL 信 号 的 条 件 以 外 ， 还 应 为 该 信号 建立 信号 处 理 程序 。 回 
忆 表 10-1， 对 于 SIGPOLL 的 默认 动作 是 终止 该 进程 ， 所 以 应 当 在 调用 ioct1 之 前 建立 信号 处 理 
程序 。 
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表 14-7 产生 SIGPOLL 信 号 的 条 件 


S_INPUT 非 高 优先 级 消息 已 到 达 

S_RDNORM 普通 消息 已 到 达 

S_RDBAND 非 0 优先 级 波段 消息 已 到 达 

S_BANDURG 车 此 常量 和 S_RDBAND 一 起 指定 ， 则 当 一 非 0 优先 级 波段 消息 已 到 达 时 ， 产 生 SIGURG 信 号 而 非 
SIGPOLL 

S_HIPRI 高 优先 级 消息 已 到 达 


S, OUTPUT 写 队 列 不 再 满 
S_WRNORM 与 S_OUTPUT 相 同 
S_WRBAND 可 发 送 非 0 优先 级 波段 消息 


S_MSG 包含 SIGPOLL 信 号 的 STREAMS 信 和 号 消息 已 到 达 
S_ERROR M ERROR 消息 已 到 达 
S_HANGUP M_HANGUP 消 息 已 到 达 


14.6.2 BSD 异 步 VO 


在 BSD 派 生 的 系统 中 ， 异 步 WO 是 SIGIO 和 SIGURG 两 个 信忠 的 组 合 。 前 者 是 通用 异步 1O 信 
号 ， 后 者 则 只 用 来 通知 进程 在 网 络 连接 上 到 达 了 带 外 的 数据 。 

为 了 接收 SIGIo 信 号 ， 需 执行 下 列 三 步 : 

(1) 调用 signal 或 sigaction 为 SIGIO 信 号 建立 信号 处 理 程序 。 

(2) 以 命令 F_SETOWN ( 见 3.14 节 ) 调用 fcnt1 来 设置 进程 ID 和 进程 组 也， 它们 将 接收 对 于 
该 描述 符 的 信号 。 

(3) 以 命令 F_SETFL 调 用 fcnt1 设 置 0_ASYNC 文 件 状 态 标 志 ， 使 在 该 描述 符 上 可 以 进行 异 
BVO ( 见 表 3-3)。 

第 (3) 步 仅 能 对 指向 终端 或 网 络 的 描述 符 执 行 ， 这 是 BSD 异 步 1O 设 施 的 一 个 基本 限制 。 

对 于 SIGURG 信 号 ， 只 需 执行 第 (1) 步 和 第 (2) 步 。 访 信号 仅 对 引用 支持 带 外 数据 的 网 络 连 接 
描述 符 而 产生 。 


14.7 readv 和 writev 函 数 


readv 和 writev 函 数 用 于 在 一 次 函数 调用 中 读 、 写 多 个 非 连 续 缓 神 区 。 有 时 也 将 这 两 个 
PRR A HA i (scatter read) 和 聚集 写 (gather write), 


#include «sys/uio.h» 


ssize_t readv(int filedes, const struct iovec *iov, int iovcnt); 


ssize t writev(int filedes, const struct iovec *iov, int iovcnt); 


两 个 函数 返回 值 : 车 成 功 则 返回 已 读 、 写 的 字 节 数 ， 若 出 错 则 返回 -1 





这 两 个 函数 的 第 二 个 参数 是 指向 iovec 结 构 数 组 的 一 个 指针 ， 


struct iovec { 
void  *iov base; /* starting address of buffer */ 
Size t iov len; /* size of buffer */ 


}; 
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iov 数 组 中 的 元 素数 由 iovcnt 说 明 。 其 最 大 值 受 限于 IOV_MAX (参见 表 2-10)。 图 14-10 显 示 了 
readv 和 writev 的 参数 和 ijovec 结 构 。 


iov [0] .iov base 
iov [0] .iov len 
iov[1] .iov_base 


iov[1].iov len 


tov [iovcnt-1] . iov base 


iov [tovcnt-1] . iov len 


图 
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14-10. reaGv 和 writev 的 ijovec 结 构 


writev 以 顺序 iov[0], iov[ 了 至 iov[iovcnt-1] 从 缓冲 区 中 聚集 输出 数据 。writev 返 回 输出 的 


字 节 总 数 ， 通 常 ， 它 应 等 于 所 有 


缓冲 区 长 度 之 和 。 


readv 则 将 读 入 的 数据 按 上 述 同样 顺序 散布 到 缓冲 区 中 。readv 总 是 先 填 满 一 个 缓冲 区 ， 然 
后 再 填写 下 一 个 。reagdv 返 回 读 到 的 总 字 节 数 。 如 果 遇 到 文件 结尾 ， 已 无 数据 可 读 ， 则 返回 0。 


这 两 个 函数 始 于 4.2BSD、 后 来 SVR4 也 提供 它们 。 在 Single UNIX Specification 的 XSI 扩 展 中 包括 了 


这 两 个 函数 。 


虽然 Single UNIX Specificalion 将 续 冲 区 地 址 定义 为 void * 类 型 ， 但 在 该 标准 前 就 已 存在 的 很 多 实 


A 
e 
Uu 


现 仍 使 用 char *, 


实 例 


在 20.8 市 的 _qdb_writeidx 函 数 中 ， 需 将 两 个 缓冲 区 内 容 连 续 地 写 到 一 个 文件 中 。 第 二 个 


缓冲 区 是 调用 者 传递 过 来 的 一 个 


参数 ， 第 一 个 缓冲 区 是 我 们 创建 的 ， 它 包含 了 第 二 个 缓冲 区 的 


长 度 以 及 在 文件 中 其 他 信息 的 偏 移 量 。 有 三 种 方法 可 以 实现 这 一 要 求 : 

(1) 调用 write 两 次 ,一 次 一 个 缓冲 区 。 

(2) 分 配 一 个 大 到 足以 包含 两 个 缓冲 区 的 新 缓冲 区 。 将 两 个 缓冲 区 的 内 容 复 制 到 新 缓冲 区 
中 。 然 后 对 该 缓冲 区 调用 write 一 次 。 

(3) 调用 writev 输 出 两 个 缓冲 区 。 


20.8 节 中 使 用 了 writev， 


但 是 将 它 与 另外 两 种 方法 进行 比较 ， 对 我 们 是 很 有 启发 的 。 


表 14-8 显 示 了 上 面 所 述 三 种 方法 的 结果 。 


表 14-8 












-次 write 
复制 绥 冲 区 、 然 后 一 次 write 


-次 writev 








比较 writev 和 其 他 技术 所 得 的 时 间 结果 








1.29 3.15 7.39 1.60 17.40 19.84 
1.03 1.98 6.47 1.10 11.09 12.54 
0.70 212 6.41 0.86 13.58 14.72 





所 用 的 测试 程序 输出 100 字 节 的 头 文件 ， 接 着 又 输出 200 字 节 的 数据 。 这 样 做 1 048 576 次 ， 
产生 了 一 个 300MB 的 文件 。 该 程序 按 上 面 描述 的 3 种 方法 分 别 编写 了 3 个 版 本 。 使 用 Fimes 
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(8.1675) 测 得 它们 在 写 操作 前 、 后 各 使 用 的 用 户 CPU 时 间 、 系 统 CPU 时 间 和 了 时钟 时 间 。 它 们 的 
单位 都 是 秒 。 

正如 我 们 所 预料 的 ， 调 用 write 两 次 的 系统 时 间 较 调用 write 或 writev 一 次 要 长 ， 这 与 
表 3-2 的 结果 类 似 。 

接着 要 注意 的 是 ， 在 缓冲 区 复制 后 跟随 一 个 wzite 所 用 的 CPU 时 间 (用 户 加 系统 ) 要 少 于 
调用 writev 一 次 所 耗费 的 CPU 了 时间。 对 于 单一 write 情况 ， 我 们 先 将 用 户 层次 的 两 个 缓冲 区 
复制 至 一 个 中 间 缓 冲 区 ， 然 后 当 调用 write 时 内 核 将 该 中 间 缓 冲 区 中 的 数据 复制 至 其 内 部 缓冲 
区 。 对 于 writev 的 情况 ， 因 为 内 核 只 需 将 数据 直接 复制 进 其 内 部 缓冲 区 ， 所 以 复制 工作 应 当 
少 一 些 。 但 是 ， 对 于 这 种 少量 数据 ， 使 用 wzitev 的 固定 开销 大 于 得 益 。 随 着 需 复制 数据 的 增 
加 ， 程 序 中 复制 缓冲 区 的 开销 也 会 增多 。 此 时 ，writev 这 种 替代 方法 就 会 有 更 大 的 吸引 力 。 


注意 不 要 依据 表 14-8 中 的 数字 对 Linux 和 MacOS X 之 间 的 相对 性 能 作 过 多 的 推断 。 这 两 种 计算 机 有 
很 大 差别 。 它 们 有 不 同 的 处 理 器 结构 、 不 同 量 的 RAM 以 及 不 同 速 度 的 古 查 。 为 了 进行 操作 系统 之 间 的 
比较 ， 需要 对 每 一 种 操作 系统 都 使 用 相同 的 硬件 。 

E 

总 之 ， 应 当 用 尽量 少 的 系统 调用 次 数 来 完成 任务 。 如 果 只 写 少 量 的 数据 ， 会 发 现 自己 复制 

数据 然后 使 用 一 次 write 会 比 用 writev 更 合算 。 但 也 可 能 发 现 ， 这 样 获得 的 性 能 提升 并 不 值 
得 ， 因 为 管理 中 间 缓 冲 区 会 增加 程序 的 复杂 度 。 


14.8 readn 和 writen 国 数 


管道 、FIFO 以 及 某 些 设备 ,特别 是 终端 、 网 络 和 STREAMS 设 备 有 下 列 两 种 性 质 ， 

(1) 一 次 read 操 作 所 返回 的 数据 可 能 少 于 所 要 求 的 数据 ， 即 使 还 没 达 到 文件 尾 端 也 可 能 是 
这 样 。 这 不 是 一 个 错误 ， 应 当 继 续 读 该 设备 。 

(2) 一 次 write 操作 的 返回 值 岂 可 能 少 于 指定 输出 的 字 节 数 。 这 可 能 是 由 若 于 因素 造成 的 ， 
例如 ， 下 游 模块 的 流量 控制 限制 。 这 也 不 是 错误 ， 应 当 继 续 写 余 下 的 数据 至 该 设备 。( 通 常 ， 
只 有 对 非 阻塞 描述 符 ， 或 捕 提 到 一 个 信号 时 ， 才 发 生 这 种 write 的 中 途 返 回 。) 

在 读 、 写 磁盘 文件 时 从 未 见 到 过 这 种 情况 ， 除 非 文 件 系统 用 完了 空间 ， 或 者 我 们 接近 了 配 
额 限制 ， 而 不 能 将 要 求 写 的 数据 全 部 写 出 。 

通常 当 读 、 写 一 个 管道 、 网 络 设 备 或 终端 时 ， 我 们 需要 考虑 这 些 特 性 。 下 面 两 个 国 数 
readn 和 writen 的 功能 是 读 、 写 指定 的 N 字 节 数 据 ， 并 处 理 返 回 值 小 于 要 求 值 的 情况 。 这 两 个 
函数 只 是 按 需 多 次 调用 read 和 write 直 至 读 、 写 了 N 字 节 数 据 。 


#include "apue.h" 


ssize t readn(int filedes, void *buf, size_t nbytes); 


ssize t writen(int filedes, void *buf, size t nbytes); 


两 个 函数 返回 值 : 已 读 、 写 字 节 数 ， 若 出 错 则 返回 -1 





类 似 于 本 书 很 多 实例 所 使 用 的 出 错 处 理 例 程 ， 我 们 定义 这 两 个 函数 的 目的 是 便于 在 后 面 实例 中 使 
用 。teadn 和 writen 函 数 并 非 任何 标准 的 组 成 部 分 。 


在 要 将 数据 写 到 上 面 提 到 的 文件 类 型 上 时 ， 就 可 调用 writen， 但 是 只 有 当 事 先 就 知道 要 接 
收 数据 的 数量 时 ， 才 调用 readn (通常 只 调用 read 接 收 来 自 这 些 设 备 的 数据 ) 。 程 序 清单 14-11 
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包含 了 writen 和 readn 的 一 种 实现 ， 在 后 面 的 实例 中 ， 我 们 将 使 用 它们 。 
程序 清单 14-11 readn 和 writen 函 数 


#include "apue.h" 


ssize_t /* Read "n" bytes from a descriptor */ 
readn(int fd, void *ptr, size t n) 


size t nleft; 
ssize t nread; 
nleft = n; 


while (nleft > 0) { 
if ((nread = read(fd, ptr, nleft)) « 0) { 
if (nleft == n) 
return(-1); /* error, return -1 */ 


else 
break; /* error, return amount read so far */ 
) eise if (nread == 0) { 
break; /* EOF */ 
} 
nleft -= nread; 


ptr += nread; 


return(n - nleft); /* return >= 0 */ 


} 


ssize t /* Write "n" bytes to a descriptor */ 
writen(int fd, const void *ptr, size t n) 


( 


size_t nleft; 
ssize_t nwritten; 
nleft = n; 


while (nleft > 0) { 
if ((nwritten = write(fd, ptr, nleft)) < 0) { 
if (nleft == n) 
return(-1); /* error, return -1 */ 


else 
break; /* error, return amount written so far */ 
} else if (nwritten == 0) { 
break; 
nleft -= nwritten; 


ptr += nwritten; 


} 


return(n - nleft); /* return >= 0 */ 


} 


注意 ， 若 在 已 经 读 、 写 了 一 些 数 据 后 出 错 ， 则 这 两 个 函数 返回 已 传输 的 数据 量 ， 而 非 出 错 
返回 。 与 此 类 似 ， 在 读 时 如 达到 文件 尾 ， 而 且 在 此 之 前 已 成 功 地 读 了 一 些 数 据 ， 但 尚未 满足 所 
|” 要求 的 量 ， 则 readGn 返 回 已 复制 到 调用 者 缓冲 区 中 的 字 节 数 。 


486 
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存储 映射 JO (Memory-mapped VO) 使 一 个 磁盘 文件 与 存储 空间 中 的 一 个 缓冲 区 相映 射 。 
于 是 当 从 缓冲 区 中 取 数 据 ， 就 相当 于 读 文件 中 的 相应 字 节 。 与 此 类 似 ， 将 数据 存 人 缓冲 区 ， 则 
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相应 字 节 就 自动 地 写 人 文件 。 这 样 就 可 以 在 不 使 用 read 和 write 的 情况 下 执行 UO。 


存储 映射 IO 伴随 虚拟 存储 系统 已 经 用 了 很 多 年 。4.1BSD (1981) 以 其 vread 和 vwrite 函 数 提供 
了 一 种 不 同形 式 的 存储 映射 TO。4.2BSD 没 有 使 用 这 两 个 函数 ， 而 是 企图 换 成 mmap 函 数 。 但 是 由 于 
McKusick et al. [1996] 2.5 节 中 说 明 的 理由 ，4.2BSD 实 际 上 并 没有 包含 mmap 函 数 。Gingell.Moran 和 
Shannon[1987] 说 明了 mmap 的 一 种 实现 。 现 在 ，Single UNIX Specification 存 储 映 射 文件 选项 中 包括 了 
mmap 函 数 ， 在 遵循 XSI 的 系统 中 则 应 包含 此 函数 。 大 多 数 UNIX 系 统 都 支持 rmaD 巴 数 。 


为 了 使 用 这 种 功能 ， 应 首先 告诉 内 核 将 一 个 给 定 的 文件 映射 到 一 个 存储 区 域 中 。 这 是 由 
mmap 国 数 实现 的 。 


#include <sys/mman.h> 


void *mmap(void *addr, size_t len, int prot, int flag, int filedes, 


off t off); 





返回 值 : 若 成 功 则 返回 映射 区 的 起 始 地 址 ， 若 出 错 则 返回 MAP_FAILED 


addr 参 数 用 于 指定 映射 存储 区 的 起 始 地 址 。 通 常 将 其 设置 为 0， 这 表示 由 系统 选择 该 映射 
区 的 起 始 地址 。 此 函数 的 返回 地 址 是 该 映射 区 的 起 始 地 址 。 

Jfiledes 指 定 要 被 映射 文件 的 描述 符 。 在 映射 该 文件 到 一 个 地 址 空间 之 前 ， 先 要 打开 该 文件 。 
len 是 映射 的 字 节 数 。of 是 要 映射 字 节 在 文件 中 的 起 始 偏 移 量 〈 下 面 将 说 明 对 off 直 有 某 些 限制 ) 。 

Prot 参 数 说 明 对 映射 存储 区 的 保护 要 求 ， 见 表 14-9。 


表 14-9 映射 存储 区 的 保护 要 求 


PROT_READ 映射 区 可 读 


PROT_WRITE 上 映射 区 可 写 
PROT_EXEC 映射 区 可 执行 
PROT_NONE 映射 区 不 可 访问 





可 将 prot 参 数 指定 为 PROT_NONE， 或 者 是 PROT_RERAD、PROT_WRITE、PROT_EXEC 任 意 组 合 
的 按 位 或 。 对 指定 映射 存储 区 的 保护 要 求 不 能 超过 文件 open 模 式 访问 权限 。 例 如 ， 若 该 文件 
是 只 读 打 开 的 ， 那 么 对 映射 存储 区 就 不 能 指定 PROT_WRITE。 

在 说 明 fiag 参 数 之 前 ， 先 看 一 下 存储 映射 文件 的 基本 情况 。 图 14-11 显 示 了 一 个 存储 映射 文 
件 。( 见 图 7-3 中 进程 存储 空间 的 典型 安排 情况 。.) 在 此 图 中 ,“ 起 始 地 址 ”是 mmap 的 返回 值 。 映 
射 存储 区 位 于 堆 和 栈 之 间 ， 这 属于 实现 细节 ， 各 种 实现 之 间 可 能 不 尽 相同 。 

flag 参 数 影响 映射 存储 区 的 多 种 属性 : 

MAP_FIXED 返回 值 必 须 等 于 addr。 因 为 这 不 利于 可 移植 性 ， 所 以 不 鼓励 使 用 此 标志 。 

如 果 示 指定 此 标志 ， 而 且 adar 非 0， 则 内 核 只 把 addr 视 为 在 何 处 设置 映 
射 区 的 一 种 建议 , 但 是 不 保证 会 使 用 所 要 求 的 地 址 。 将 addr 指 定 为 0 可 获 
得 最 大 可 移植 性 。 


在 遵循 POSIX 的 系统 中 ， 对 MAP_FIXED 的 支持 是 可 选择 的 ， 但 遵循 XSI 的 系统 则 要 求 支 持 
MAP FIXED, 


MAP SHARED ”这 一 标志 说 明了 本 进程 对 映射 区 所 进行 的 存储 操作 的 配置 。 此 标志 指定 
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存储 操作 修改 映射 文件 ， 也 就 是 说 ， 存 储 操作 相当 于 对 该 文件 的 write。 
必须 指定 本 标志 或 下 一 个 标志 (MAP_PRIVATE)， 但 不 能 同时 指定 两 者 。 
MAP PRIVATE 本 标志 说 明 ， 对 映射 区 的 存储 操作 导致 创建 该 映射 文件 的 一 个 私有 副本 。 
所 有 后 来 对 该 映射 区 的 引用 都 是 引用 该 副本 ， 而 不 是 原始 文件 。( 此 标志 
的 一 种 用 途 是 用 于 调试 程序 ， 它 将 一 程序 文件 的 正文 部 分 映射 至 一 存储 
区 ， 但 允许 用 户 修改 其 中 的 指令 。 任 何 修改 只 影响 程序 文件 的 副本 ， 而 
不 影响 原文 件 。) 
每 种 实现 都 可 能 还 有 另外 一些 MAP_xxx 标 志 值 ， 它 们 是 这 种 实现 所 特有 的 。 详 细 情 况 请 参见 你 
所 使 用 系统 的 mmap(2) 手 册页 。 


高 地 址 


文件 的 映射 us 
存储 区 部 分 


起 始 地 址 


未 初始 化 数据 (bss) 
已 初始 化 数据 


Y 
1 
1 
1 
1 
1 
| 
1 
1 
1 
1 
1 








文件 的 映射 
低地 址 存储 区 部 分 


图 14-11 存储 映射 文件 的 例子 


off 和 addr 的 值 ( 如 果 指 定 了 MAP_FIXED) 通常 应 当 是 系统 虚 存 页 长 度 的 倍数 。 ETK 
可 用 带 参数 SC_PAGESIZER SC PAGE SIZE[Ójsysconfi&Ét ( 见 2.5.4 节 ) 得 到 。 因 为 off 
和 adcdr 常 常 指定 为 0， 所 以 这 种 要 求 一 . 般 并 不 重要 。 

因为 映射 文件 的 起 始 偏 移 量 受 系统 虚 存 页 长 度 的 限制 ， 那么 如 果 映 射 区 的 长 度 不 是 页 长 的 
整数 倍 时 ， 将 如 何 呢 ? 假定 文件 长 12 字 告 ， 系 统 页 长 为 512 字 节 ， 则 系统 通常 提供 512 字 节 的 上 映 
射 区 ， 其 中 后 500 字 节 被 设置 为 0。 可 以 修改 这 500 字 节 ， 但 任何 变动 都 不 会 在 文件 中 反映 出 来 。 
于 是 ， 我 们 不 能 用 mmap 将 数据 添加 到 文件 中 。 为 了 做 到 这 一 点 ， 我 们 必须 首先 加 长 该 文件 ， 
这 将 示 于 程序 清单 14-12 中 。 

与 映射 存储 区 相关 的 有 SIGSEGV 和 SIGBUS 了 两 个 信号 。 信 号 SIGSEGV 通 常用 于 指示 进程 斌 
图 访问 对 它 不 可 用 的 存储 区 。 如 有 果 进 程 企 图 存 数据 到 mmap 指 定 为 只 读 的 映射 存储 区 ， 孝 么 也 
产生 此 信和 号。 如 果 访 问 上 映射 区 的 某 个 部 分 ， 而 在 访问 时 这 一 部 分 实际 上 已 不 存在 ， 则 产生 
SIGBUS 信 号 。 例 如 ， 用 文件 长 度 映射 了 一 -个 文件 ， 但 在 引用 该 映射 区 之 前 ， 另 一 个 进程 已 将 
该 文件 截 短 ， 此 时 ， 如 果 进 程 企 图 访问 对 应 于 该 文件 已 截 去 部 分 的 映射 区 ， 则 会 接收 到 
SIGBUS 信 和 号。 
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在 调用 fork 之 后 ， 子 进程 继承 存储 映射 区 〈 因 为 子 进程 复制 父 进程 地 址 空间 ， 而 存储 映 
射 区 是 该 地 址 空间 中 的 一 部 分 ) ， 但 是 由 于 同样 的 理由 ， 调 用 exec 后 的 新 程序 则 不 继承 此 存储 
映射 区 。 

调用 mprotect 可 以 更 改 一 个 现存 映射 存储 区 的 权限 。 


#include <sys/mman.h> 


int mprotect (void *addr, size_t len, int prot); 





返回 值 ， 若 成 功 则 返回 9。 若 出 错 则 返回 一 1 


prot 的 许可 值 与 nmap 中 prot 参 数 一 样 ( 表 14-9) 。 地 址 参数 addr 的 值 必须 是 系统 页 长 的 整 
数 倍 。 
在 Single UNIX Specification 中 ，mprotect 函 数 是 存储 保护 选项 中 的 组 成 部 分 ， 遵 循 XSI 的 系统 要 
求 支持 它 。 
如 果 在 共享 存储 映射 区 中 的 页 已 被 修改 ， 那 么 我 们 可 以 调用 msync 将 该 页 冲洗 到 被 映射 的 
文件 中 。msync 函 数 类 似 于 fsync (3.13 节 )， 但 作用 于 存储 映射 区 。 


#include <sys/mman.h> 


int msync(void *addr, size_t len, int flags); 


返回 值 : 车 成 功 则 返回 9?， 若 出 错 则 返回 一 1 


如 果 映 射 是 私有 的 ， 那 么 不 修改 被 映射 的 文件 。 与 其 他 存储 映射 函数 一 样 ， 地 址 必须 与 页 
边界 对 齐 。 

flags 参 数 使 我 们 对 如 何冲 洗 存 储 区 有 某 种 程度 的 控制 。 我 们 可 以 指定 MS_ASYNC 标 志 以 简 
化 被 写 页 的 调度 。 如 果 我 们 希望 在 返回 之 前 等 待 写 操作 完成 ， 则 可 指定 MS_SYNC 标 志 。 一 定 要 
指定 MS_ASYNC 和 MS_SYNC 中 的 一 个 。 

MS_INVALIDATE 是 一 个 可 选 标 志 ， 使 用 它们 以 通知 操作 系统 丢弃 与 底层 存储 器 没有 同步 
的 任何 页 。 若 使 用 了 此 标志 ， 某 些 实现 将 丢弃 在 指定 范围 中 的 所 有 页 ， 但 这 并 不 是 所 期 望 的 。 

进程 终止 时 ， 或 调用 了 munmap 之 后 ， 存 储 映 射 区 就 被 自动 解除 映射 。 关 闭 文件 描述 符 
filedes 并 不 解除 映射 区 。 





#include <sys/mman.h> 


int munmap (caddr t addr, size t len); 


返回 值 ， 若 成 功 则 返回 9， 若 出 错 则 返回 一 1 





munmap 不 会 影响 被 映射 的 对 象 ， 也 就 是 说 ， 调 用 munmap 不 会 使 映射 区 的 内 容 写 到 磁盘 文 
件 上 。 对 于 MAP_SHARED 区 磁盘 文件 的 更 新 ， 在 写 到 存储 映射 区 时 按 内 核 虚 存 算法 自动 进行 。 
在 解除 了 映射 后 ， 对 于 MAP_PRIVATE 存 储 区 的 修改 被 丢弃 。 

Sc fil 
程序 清单 14-12 用 存储 映射 UO 复制 一 个 文件 (RF cpa). 
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程序 清单 14-12 用 存储 映射 VO 复 制 文件 


#include "apue .hn 
#include «fcntl.h» 
#include «sys/mman.h» 


int 


main(int argc, char *argv[]) 


} 


int fdin, fdout; 
void *src, *dst; 
struct stat statbuf; 


if (arge != 3) 
err quit("usage: $s <fromfile> «tofile»", argv[0]); 


if ((fdin = open(argv[1], O RDONLY)) « 0) 
err sys("can't open $s for reading", argv[1]); 


if ((fdout - open(argv[2], O RDWR | O CREAT | O TRUNC, 
FILE MODE)) « 0) 
err sys("can't creat %s for writing", argv[2]); 


if (fstat(fdin, &statbuf) < 0) /* need size of input file */ 
err sys("fstat error"); 


/* set size of output file */ 

if (lseek(fdout, statbuf.st size - 1, SEEK SET) -- -1) 
err sys("lseek error"); 

if (write(fdout, "", 1) != 1) 
err sys("write error"); 


if ((src = mmap(0, statbuf.st size, PROT READ, MAP SHARED, 
fdin, 0)) == MAP_FAILED) 
err_sys("mmap error for input"); 


if ((dst = mmap(0, statbuf.st_size, PROT_READ | PROT WRITE, 
MAP_SHARED, fdout, 0)) == MAP_FAILED) 
err_sys("mmap error for output") ; 


memcpy(dst, src, statbuf.st_size); /* does the file copy */ 
exit (0); 





该 程序 首先 打开 两 个 文件 ， 然 后 调用 fstat 得 到 输入 文件 的 长 度 。 在 为 输入 文件 调用 
mmap 和 设置 输出 文件 长 度 时 都 需 使 用 输入 文件 长 度 。 调 用 1seek， 然 后 写 一 个 字 节 以 设置 输 
出 文件 的 长 度 。 如 果 不 设置 输出 文件 的 长 度 ， 则 对 输出 文件 调用 mmap 也 可 以 ， 但 是 对 相关 存 
储 区 的 第 一 次 引用 会 产生 SIGBUS。 也 可 使 用 ftruncate 函 数 来 设置 输出 文件 的 长 度 ， 但 是 并 
非 所 有 系统 都 支持 该 函数 扩充 文件 长 度 ( 见 4.13 节 )。 


在 本 书 讨论 的 四 种 平台 上 ， 都 可 用 ftruncate 扩 展 文 件 。 


然后 对 每 个 文件 调用 mmap ， 将 文件 映射 到 存储 区 ， 最 后 调用 memcpy 将 输入 缓冲 区 的 内 容 
复制 到 输出 缓冲 区 。 在 从 输入 缓冲 区 (src) 取 数 据 字 节 时 ， 内 核 自动 读 输入 文件 ， 在 将 数据 
存 人 输出 缓冲 区 (dst) 时 ， 内 核 自 动 将 数据 写 到 输出 文件 中 。 


数据 被 写 入 文件 的 确切 时 间 依 赖 于 系统 的 页 管理 算法 。 某 些 系统 设置 了 守护 进程 ， 在 系统 运行 期 
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fa]. “MRI” HILDA SRA EL, RBSRARRBESHSEATHY, NEAMBALM 
jede 志 调 用 msync 。 


将 存储 区 映射 复制 与 用 read，write 进 行 的 复制 (缓冲 区 长 度 为 8 192) 相 比 较 ， 得 到 表 
14-10 中 所 示 的 结果 。 其 中 ， 时 间 单 位 是 秒 ， 被 复制 文件 的 长 度 是 300MB。 


表 14-10 read/write 与 mmap/memcpy 比 较 的 时 间 结 果 





对 于 Solaris 9， 两 种 复制 方式 的 CPU 时 间 (用 户 + 系统 ) 几乎 相同 : 9.88s 对 9.62s。 对 于 
Linux 2.4.22，mmap/memcpy 方 式 的 CPU 时 间 大 约 是 zead/write 方 式 的 两 倍 。 这 种 差别 可 能 
是 由 两 种 系统 实现 在 处 理 时 间 计 算 方 面 所 使 用 的 方法 不 同 而 造成 的 。 

如 果 考 虑 到 时 钟 时 间 ， 那 么 mmap 和 memcpy 方 式 较 read 和 write 方式 要 快 。 这 是 合 情 合 
理 的 。 使 用 mmap 和 memcpy 时 做 的 工作 要 少 。 用 zead 和 write 时 ， 要 先 将 数据 从 内 核 缓冲 区 
复制 到 应 用 程序 缓冲 区 (read)， 然 后 又 将 应 用 程序 缓冲 区 中 的 数据 复制 至 内 核 缓冲 区 
(write)。 用 mmap 和 memcpy 时 ， 则 直接 将 映射 到 应 用 程序 地 址 空间 的 一 个 内 核 缓冲 区 中 的 数 
据 复制 到 另 一 个 同样 映射 到 应 用 程序 地 址 空间 中 的 内 核 缓冲 区 中 。 口 


将 一 个 普通 文件 复制 到 另 一 个 普通 文件 中 时 ， 存 储 映射 TO 比 较 快 。 但 是 有 一 些 限制 ， 例 
如 ， 不 能 用 其 在 某 些 设备 人 之 间 进 行 复制 ， 并 且 在 对 被 复制 的 文 
件 进行 映射 后 ， 也 要 注意 该 文件 的 长 度 是 否 改变 。 尽 管 如 此 ， 某 些 应 用 程序 会 从 存储 映射 IO 
得 到 好 处 ， 因 为 它 处 理 的 是 存储 空间 而 不 是 读 、 写 一 个 文件 ， 所 以 常常 可 以 简化 算法 。 从 存 
储 映射 LO 中 得 益 的 一 个 例子 是 对 帧 缓冲 区 设备 的 操作 ， 该 设备 引用 一 个 位 图 式 显 示 (bit- 
mapped display) 。 

KriegerStumm 和 Unraup[1992] 第 5 章 说 明了 一 个 使 用 存储 映射 TO 的 标准 VO 库 。 

15.9 节 将 回 过 头 来 讨论 存储 映射 TO ， 用 一 -个 例子 说 明 如 何 使 用 存储 映射 7O 在 有 关 进 程 间 
提供 共享 存储 区 。 


14.10 小 结 


本 章 说 明了 很 多 高 级 MO 功能 ， 其 中 大 多 数 将 在 后 面 章节 的 例子 中 使 用 : 

。 非 阻塞 MO 一 一 发 一 个 MO 操作 ， 不 使 其 阻塞 。 

。 记 录 锁 (在 第 20 章 数据 库 函 数 库 中 有 一 个 实例 ， 将 对 此 作 更 详细 的 讨论 ) 。 

。 系 统 V 流 机 制 (在 第 17 章 中 ， 我 们 将 需要 使 用 这 部 分 内 容 以 理解 基于 STREAMS 的 管道 、 
传送 文件 描述 符 以 及 系统 V 的 客户 /服务 器 连接 )。 

。LO 多 路 转 接 一 一 select 和 pol1 函 数 ( 后 面 的 很 多 实例 将 用 到 这 两 个 函数 )。 

。readv 和 writev 函 数 (后 面 的 很 多 实例 也 将 用 到 这 两 个 函数 )。 

。 存 储 映射 UO (mmap). 
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习题 


14.1 


14.2 


14.3 


14.4 


14.5 
14.6 


14.7 


14.8 
14.9 


编写 一 个 测试 程序 以 说 明 你 所 用 系统 在 下 列 情况 下 的 运行 情况 ; 一 个 进程 在 试图 对 一 个 
文件 的 某 个 范围 加 写 锁 的 时 候 阻 塞 ， 之 后 其 他 进程 又 提出 了 一 些 相关 的 加 读 锁 请 求 。 试 
图 加 写 锁 的 进程 会 不 会 因 其 他 进程 的 行为 而 饿 死 ? 

查看 你 所 用 系统 的 头 文件 ， 并 研究 select 和 四 个 FD_ 宏 的 实现 。 

系统 头 文件 通常 对 fd_set 数 据 类 型 可 以 处 理 的 最 大 描述 符 数 有 一 个 内 置 的 限制 ， 假设 需 
要 将 描述 符 数 限制 增加 到 2 048， 该 如 何 实现 ? 

比较 处 理 信号 集 的 函数 ( 见 10.11 节 ) 和 处 理 Ea_set 描 述 符 集 的 函数 ， 并 比较 在 你 的 系 
统 上 实现 它们 的 方法 。 

getmsg 可 以 返回 多 少 种 不 同 的 信息 ? 

用 select 或 pol1 实 现 一 个 与 sleep 类 似 的 函数 sleep_us， 不 同 之 处 是 要 等 待 指 定 的 
若干 微 秒 。 比 较 这 个 函数 和 BSD 中 的 usleep 函 数 。 

是 否 可 以 利用 建议 性 记录 锁 来 实现 程序 清单 10-17 中 的 函数 TELL_WAIT、TELI_PARENT、 
TELL CHILD, WAIT PARENTUAXWAIT CHILD? 如 果 可 以 ， 编 写 这 些 函 数 并 测试 其 功能 。 
用 非 阻塞 写 测试 管道 的 容量 。 将 其 值 与 第 2 章 的 PIPE_BUF 的 值 比较 。 

回忆 表 14-8， 在 你 的 系统 上 找到 一 个 转折 点 ， 从 此 点 开始 ， 使 用 wri tev 将 快 于 你 自己 复 
制 数据 并 使 用 单个 write。 


14.10 运行 程序 清单 14-12 所 列 程序 复制 一 个 文件 ， 检 查 输入 文件 的 上 一 次 访问 时 间 是 否 改 


ET? 


14.11. 在 程序 清单 14-12 中 ， 在 调用 mmap 后 调用 cl ose 关 闭 输入 文件 ， 以 验证 关闭 描述 符 不 会 


使 内 存 映射 XO 失效 。 
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第 1S 章 
进程 则 通信 


15.1 引言 


第 8 章 说 明了 进程 控制 原 语 并 且 观 察 了 如 何 调用 多 个 进程 。 但 是 这 些 进程 之 间 交 换 信息 的 
方法 只 能 是 经 由 fork 或 exec 传 送 打开 文件 ， 或 者 通过 文件 系统 。 本 章 将 说 明 进 程 之 间 相 互通 
信 的 其 他 技术 一 一 IPC (InterProcess Communication) , 

过 去 ，UNIX 系 统 IPC 是 各 种 进程 通信 方式 的 统称 ， 但 是 ， 其 中 极 少 能 在 所 有 UNIX 系 统 实 
现 中 进行 移植 。 随 着 POSIX 和 Open Group (以 前 是 X/Open) 标准 化 的 推进 和 影响 的 扩大 ， 情 
况 虽 已 得 到 改善 ， 但 差别 仍然 存在 。 表 15-1 摘 要 列 出 了 本 书 讨论 的 四 种 实现 所 支持 的 不 同形 式 
的 IPC 。 


表 15-1 UNIX 系 统 IPC 摘 要 


IPC 类 型 | mew — | ss | FreeBSD 52.1 | Linux 2.4.22 | MacOSX 103 


半 双 工 管道 (4) (4) 
FIFO . z 
全 双 工 管道 +,UDS opt, UDS UDS *, 
命名 全 双 工 管道 XSI 可 选 UDS opt, UDS UDS +, UDS 

消息 队列 XSI 

信和 号 量 XSI 

共享 存储 XSI 


[mes | we] | we | | .| 
STREAMS XSI 可 选 

注意 ，Single UNIX Specification (“SUS” 列 ) 要 求 的 是 半 双 工 管道 ， 但 允许 实现 支持 全 双 
工 管道 。 若 应 用 程序 在 编写 时 假定 基础 操作 系统 只 支持 半 双 工 管道 ， 那 么 支持 全 双 工 管道 的 实 
现 仍 将 使 这 种 应 用 程序 正常 工作 。 表 中 使 用 “(全 )” 而 非 黑 点 显示 用 全 双 工 管道 支持 半 双 工 管 
道 的 实现 。 

在 表 15-1 中 的 黑 点 表示 基本 功能 得 到 支持 。 对 于 全 双 工 管道 ， 如 果 经 由 UNIX 域 套 接 字 ( 见 
17.3 节 ) 支持 该 特征 ， 则 在 相应 列 中 标示 “UDS”。 某 些 实现 用 管道 和 UNIX 系 统 域 套 接 字 支 持 
该 特征 ， 所 以 相关 位 置 表示 为 “UDS” 和 一 个 黑 点 。 

正如 在 14.4 节 所 提 到 的 那样 ， 在 Single UNIX Specification 中 ， 对 STREAMS 的 支持 是 可 选择 
的 。 命 名 全 双 工 管道 是 作为 已 装配 的 基于 STREAMS 的 管道 提供 的 ， 所 以 在 Single UNIX 
Specification 中 它 也 是 可 选 的 。 在 Linux 中 ， 对 STREAMS 的 支持 是 可 用 的 ， 但 依靠 称 为 “LiS” 
(Linux STREAMS) 的 单独 可 选择 包 。 在 平台 对 相应 特征 以 可 选择 包 方 式 提供 支持 时 ， 相 应 位 
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置 标 示 为 “opt”"， 可 选择 包 通 常 并 非 是 默认 安装 的 。 

表 15-1 中 前 7 种 IPC 通 常 限于 同一 台 主 机 的 各 个 进程 间 的 I[PC。 最 后 两 种 ， 即 套 接 字 和 
STREAMS， 是 仅 有 的 两 种 支持 不 同 主机 上 各 个 进程 间 IPC 的 类 型 。 

我 们 将 有 关 IPC 的 讨论 分 成 3 章 。 本 章 讨论 经 典 的 IPC: 管道 、FIFO、 消 息 队列 、 信 号 量 以 
及 共享 存储 器 。 下 一 章 将 观察 使 用 套 接 字 的 网 络 PC。 第 17 章 将 考查 IPC 的 某 些 高 级 特征 。 


15.2 管道 


管道 是 UNIX 系 统 IPC 的 最 古老 形式 ， 并 且 所 有 UNIX 系 统 都 提供 此 种 通信 机 制 。 管 道 有 下 
面 两 种 局 限 性 : 

(1) 历史 上 ， 它 们 是 半 双 工 的 〈 即 数据 只 能 在 一 个 方向 上 流动 )。 现 在 ， 某 些 系统 提供 全 双 
工 管道 ， 但 是 为 了 最 佳 的 可 移植 性 ， 我 们 决 不 应 预先 假定 系统 使 用 此 特性 。 

(2) 它们 只 能 在 具有 公共 祖先 的 进程 之 间 使 用 。 通 常 ， 一 个 管道 由 一 个 进程 创建 ， 然 后 该 
进程 调用 fork， 此 后 父 、 子 进程 之 间 就 可 应 用 该 管道 。 

我 们 将 会 看 到 FIFO ( 见 15.5 节 ) 没有 第 二 种 局 限 性 ，UNIX 域 套 接 字 ( 见 17.3) 和 命名 流 管 
道 〈 见 17.2.2 节 ) 则 设 有 这 两 种 局 限 性 。 

尽管 有 这 两 种 局 限 性 ， 半 双 工 管道 仍 是 最 常用 的 IPC 形 式 。 每 当 你 在 管道 线 中 键入 一 个 
由 shell 执 行 的 命令 序列 时 ，shell 为 每 一 条 命令 单独 创建 一 进程 ， 然 后 将 前 一 条 命令 进程 的 标准 
输出 用 管道 与 后 一 条 命令 的 标准 输入 相连 接 。 

管道 是 由 调用 pipe 函 数 而 创建 的 : 


#include <unistd.h> 


int pipe(int filedes[2]) ; 


返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 -1! 





经 由 参数 filedes 返 回 两 个 文件 描述 符 : filedes[0] 为 读 而 打开 ,filedes[1] 为 写 而 打开 。 
filedes[1] 的 输出 是 filedes[0] 的 输入 。 


在 4.3BSD、4.4BSD 和 Mac OS X 10.3 中 ， 管 道 是 用 UNIX 域 套 接 字 实现 的 。 虽然 UNIX 域 套 接 
字 是 默认 全 双 工 的 ， 但 这 些 操作 系统 对 用 于 管道 的 套 接 字 进行 了 处 理 ， 使 这 些 管 道 只 以 夺 双 工 模式 
操作 。 

POSIX.1 九 许 实现 支 持 全 双 工 管道 。 对 于 这 些 实 现 ，jiledes/O1 和 Jiledesf11 以 读 / 写 方式 打开 。 


有 两 种 方法 来 描绘 一 个 半 双 工 管道 ， 见 图 15-1。 左 半 图 显示 了 管道 的 两 端 在 一 个 进程 中 相 
互 连 接 ， 右 半 图 则 说 明 数 据 通过 内 核 在 管道 中 流动 。 

Estat ree (95.4.25) 对 管道 的 每 一 端 都 返回 一 个 FIFO 类 型 的 文件 描述 符 ， 可 以 用 
S_ISFIFO 宏 来 测试 管道 。 


FOS1X.1 规 定 stat 结 构 的 st_size 成 员 对 于 管道 是 未 定义 的 。 但 是 当 fstat 函 数 应 用 于 管道 读 端 
的 文件 描述 符 时 ， 很 多 系统 在 sSL_size 中 存放 管道 中 可 用 于 读 的 字 节 数 。 但 是 ， 这 是 不 可 移植 的 。 


单个 进程 中 的 管道 几乎 没有 任何 用 处 。 通 常 ， 调 用 pipe 的 进程 接着 调用 fork， 这 样 就 创 
建 了 从 父 进程 到 子 进程 (或 反 向 ) 的 IPC 通 道 。 图 15-2 显 示 了 这 种 情况 。 
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图 15-1 ”观察 半 双 工 管道 的 两 种 方法 
调用 fork 之 后 做 什么 取决 于 我 们 想 要 有 的 数据 流 的 方向 。 对 于 从 父 进 程 到 子 进程 的 管道 ， 
父 进程 关闭 管道 的 读 端 (fa10] )， 子 进程 则 关闭 写 端 (faf1] )。 图 15-3 显 示 了 在 此 之 后 描述 
符 的 安排 。 


父 进程 
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子 进程 父 进程 TEE 










fd[0]  fd[1] 











内 核 内 核 
图 15-2 调用 fork 之 后 的 半 双 工 管道 图 15-3 从 父 进程 到 子 进 程 的 管道 


为 了 构造 从 子 进程 到 父 进程 的 管道 ， 父 进程 关闭 fda[1] ， 子 进程 关闭 fa[0]。 

当 管 道 的 一 端 被 关闭 后 ， 下 列 两 条 规则 起 作用 ， 

(1) 当 读 一 个 写 端 已 被 关闭 的 管道 时 ， 在 所 有 数据 都 被 读 取 后 ，read 返 回 0， 以 指示 达到 了 
文件 结束 处 。( 从 技术 方面 考虑 ， 管 道 的 写 端 还 有 进程 时 ， 就 不 会 产生 文件 的 结束 。 可 以 复制 一 
个 管道 的 描述 符 ， 使 得 有 多 个 进程 对 它 具 有 写 打 开 文 件 描述 符 。 但 是 ， 通 常 一 个 管道 只 有 一 个 读 
进程 、 一 个 写 进程 。 下 一 节 介绍 FIFO 时 ， 我 们 会 看 到 对 于 一 个 单一 的 FIFO 常 常 有 多 个 写 进程 。) 

(2) 如 果 写 一 个 读 端 已 被 关闭 的 管道 ， 则 产生 信号 SIGPIPE。 如 果 忽 略 该 信号 或 者 捕 提 该 
信和 号 并 从 其 处 理 程序 返回 ， 则 write 返回 -1，erzrno 设 置 为 BPIPE。 

在 写 管道 (或 FIFO) 时 ， 常 量 PIPE_BUF 规 定 了 内 核 中 管道 缓冲 区 的 大 小 。 如 果 对 管道 调 
用 write， 而 且 要 求 写 的 字 节 数 小 于 等 于 PIPE_BUF， 则 此 操作 不 会 与 其 他 进程 对 同一 管道 
(或 FIFO) 的 write 操 作 穿 插 进 行 。 但 是 ， 若 有 多 个 进程 同时 写 一 个 管道 (或 FIFO) ， 而 且 有 
进程 要 求 写 的 字 节 数 超过 PIPE_BUF 字 节 数 时 ， 则 写 操 作 的 数据 可 能 相互 穿插 。 用 pathconf 
或 fpathconf 函 数 ( 见 表 2-11) 可 以 确定 PIPE_BUF 的 值 。 






程序 清单 15-1 创 建 了 一 个 从 父 进程 到 子 进程 的 管道 ， 并 且 父 进程 经 由 该 管道 向 子 进程 传送 
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数据 。 
程序 清单 15-1 经 由 管道 父 进程 向 子 进 程 传送 数据 
#include "apue.h" 


int 
main (void) 


int n; 

int fd[2]; 

pid t pid; 

char line[MAXLINE]; 


if (pipe(fd) « 0) 
err_sys("pipe error"); 

if ((pid = fork()) « 0) { 
err_sys ("fork error"); 


} else if (pid > 0) { /* parent */ 
close(fd[0]); 
write(fd[1], "hello world\n", 12); 

} else { /* child */ 
close(fd[11); 


n = read(fd[0], line, MAXLINE); 
write(STDOUT FILENO, line, n); 


exit(0); 





口 

在 上 面 的 例子 中 ， 直 接 对 管道 描述 符 调用 read 和 write。 更 好 的 方法 是 将 管道 描述 符 复 

制 为 标准 输入 和 标准 输出 。 在 此 之 后 通常 子 进程 执行 另 一 个 程序 ， 该 程序 或 者 从 标准 输入 (已 
创建 的 管道 ) 读数 据 ， 或 者 将 数据 写 至 其 标准 输出 (该 管道 ) 。 





试 编写 一 个 程序 ， 其 功能 是 每 次 一 页 显示 已 产生 的 输出 。 已 经 有 很 多 UNIX 系 统 实用 程序 
具有 分 页 功能 ， 因 此 无 需 再 构造 一 个 新 的 分 页 程序 ， 而 是 调用 用 户 最 喜爱 的 分 页 程序 。 为 了 避 
免 先 将 所 有 数据 写 到 一 个 临时 文件 中 ， 然 后 再 调用 系统 中 有 关 程 序 显示 该 文件 ， 我 们 希望 将 输 
出 通过 管道 直接 送 到 分 页 程序 。 为 此 ， 先 创建 一 个 管道 ， 调 用 fork 产 生 一 个 子 进程 ， 使 子 进 
程 的 标准 输入 成 为 管道 的 读 端 ， 然 后 调用 exec， 执 行 用 户 喜爱 的 分 页 程序 。 程 序 清单 15-2 显 示 
了 如 何 实现 这 些 操作 。 (本 例 要 求 在 命令 行 中 有 一 个 参数 说 明 要 显示 文件 的 名 称 。 通 常 ， 这 种 
类 型 的 程序 要 求 在 终端 上 显示 的 数据 已 经 在 存储 器 中 。) 


程序 清单 15-2 将 文件 复制 到 分 页 程序 


#include "apue.h" 
#include «sys/wait.h» 


#define DEF PAGER "/bin/more" /* default pager program */ 
int 
main(int argc, char *argv[]) 

int n; 


int f£d[2]; 
pid t pid; 
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char *pager, *argv0; 
char line [MAXLINE] ; 
FILE *fp; 


if (argc != 2) 
err quit("usage: a.out <pathname>") ; 


if ((fp = fopen(argv[1], "r")) == NULL) 
err_sys("can’t open $s", argv[1]); 
if (pipe(fd) < 0) 
err sys("pipe error"); 
if ((pid = fork0) < 0) { 
err sys ("fork error"); 


} else if (pid > 0) { /* parent */ 
close(fd[0]); /* close read end */ 
/* parent copies argv[1] to pipe */ 
while (fgets(line, MAXLINE, fp) != NULL) { 
n = gtrlen(line); 
if (write(fd[1], line, n) != n) 


err_sys("write error to pipe"); 


} 
if (ferror (fp) ) 
err_sys("fgets error"); 


close(fd[1]); /* close write end of pipe for reader */ 


if (waitpid(pid, NULL, 0) « 0) 
err_sys ("waitpid error"); 


exit (0); 
} else { /* child */ 
close(fd[1]); /* close write end */ 
if (fd[0] !- STDIN FILENO) { 
if (dup2(fd[0], STDIN FILENO) !- STDIN FILENO) 
err sys("dup2 error to stdin"); 
close (fd[01); /* don't need this after dup2 */ 
} 
/* get arguments for execl() */ 
if ((pager = getenv("PAGER")) == NULL) 
pager = DEF PAGER; 
if ((argvO = strrchr (pager, '/')) != NULL) 
argv0t++; /* step past rightmost slash */ 
else 


argvO = pager; /* no slash in pager */ 


if (execl (pager, argvO, (char *)0) < 0) 
err_sys("execl error for $8", pager); 


exit(0); 


在 调用 fork 之 前 先 创建 一 个 管道 。forkx 之 后 父 进程 关闭 其 读 端 ， 子 进程 关闭 其 写 端 。 子 


进程 然后 调用 aup2 ， 使 其 标准 输入 成 为 管道 的 读 端 。 当 执行 分 页 程序 时 ， 其 标准 输入 将 是 管 

当 我 们 将 一 个 描述 符 复 制 到 另 一 个 时 (在 子 进程 中 ，fa10] 复 制 到 标准 输入 ) ， 应 当 注 意 
在 复制 之 前 该 描述 符 的 值 并 不 是 所 希望 的 值 。 如 果 该 描述 符 已 经 具有 所 希望 的 值 ， 并 且 我 们 先 
调用 aup2 ， 然 后 调用 close 则 将 关闭 此 进程 中 只 有 该 单个 描述 符 所 代表 的 打开 文件 。( 回 忆 
3.12 节 中 所 述 ， 当 aup2 中 的 两 个 参数 值 相 等 时 的 操作 。) 在 本 程序 中 ， 如 果 shell 没 有 打开 标准 
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输入 ， 那 么 程序 开始 处 的 fopen 应 已 使 用 描述 符 0， 也 就 是 最 小 未 使 用 的 描述 符 ， 所 以 f310] 
决 不 会 等 于 标准 输入 。 尽 管 如 此 ， 只 要 先 调 用 aup2 ， 然 后 调用 close 以 复制 一 个 描述 符 到 另 
一 个 ， 作 为 一 种 保护 性 的 编程 措施 ， 我 们 总 是 先 将 两 个 描述 符 进行 比较 。 

请 注意 ， 我 们 是 如 何 使 用 环境 变量 PAGER 试 图 获得 用 户 分 页 程序 名 称 的 。 如 果 这 种 操作 没 
有 成 功 ， 则 使 用 系统 默认 值 。 这 是 环境 变量 的 常见 用 法 。 m 





回忆 8.9 节 中 的 5 个 函数 ; TELL WAIT, TELL PARENT, TELL CHILD, WAIT. PARENT 
以 及 WAIT_CHILD。 程 序 清单 10-17 提 供 了 一 个 使 用 信号 的 实现 。 程 序 清单 15-3 则 是 一 个 使 用 管 
道 的 实现 。 


程序 清单 15-3 使 父 、 子 进程 同步 的 例 程 
#include "apue.h" 
static int pfd1[2], pfd2[2]; 


void 
TELL_WAIT (void) 


if (pipe(pfd1) < 0 || pipe(pfd2) < 0) 
err_sys("pipe error"); 


} 


void 
TELL_PARENT (pid t pid) 
{ 
if (write(pfd2[1], "c", 1) !- 1) 
err sys("write error"); 


) 


void 
WAIT PARENT (void) 


char C; 


if (read(pfd1[0], &c, 1) != 1) 
err sys("read error"); 


if (c != 'p') 
err quit("WAIT PARENT: incorrect data"); 


) 


void 
TELL CHILD(pid t pid) 


if (write(pfdi[1], "p", 1) != 1) 


err_sys ("write error"); 


} 


void 
WAIT CHILD (void) 


char Cc; 


if (read(pfd2[0], &c, 1) != 1) 
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err_sys ("read error"); 


if (c != 'c') 
err quit("WAIT CHILD: incorrect data"); 


如 图 15-4 所 示 ， 在 fork 之 前 创建 了 两 个 管道 。 父 进程 在 调用 TELL_CHILD 时 ， 写 一 个 字符 


“p” 至 上 一 个 管道 ， 子 进程 在 调用 TELL_PARENT 时 ， 经 由 下 一 个 管道 写 一 个 字符 “c”。 相 应 
的 WAIT_xxx 函 数 调用 read 读 这 个 字符 ， 并 发 生 阻塞 。 
父 进程 子 进程 


pfdi [i] 





pfd2{o] 


图 15-4 用 两 个 管道 实现 父子 进程 同步 


请 注意 ， 每 一 个 管道 都 有 一 个 额外 的 读 取 进 程 ， 这 没有 关系 。 也 就 是 说 ， 除 了 子 进程 从 
pfal[0] 读 取 ， 父 进程 也 有 上 一 个 管道 的 读 端 。 因 为 父 进程 并 没有 执行 对 该 管道 的 读 操作 ， 所 
以 这 不 会 产生 任何 影响 。 a 


15.3 popen 和 pclose 顶 数 


常见 的 操作 是 创建 一 个 管道 连接 到 另 一 个 进程 ,然后 读 其 输出 或 向 其 输入 端 发 送 数据 , 为 此 ， 
标准 IO 库 提 供 了 两 个 图 数 popen 和 pclose。 这 两 个 函数 实现 的 操作 是 : 创建 一 个 管道 ， 调 用 
fozrk 产 生 一 个 子 进程 ， 基 闭 管 道 的 不 使 用 端 ， 执 行 一 个 she1L1 以 运行 命令 ， 然 后 等 待命 令 终止 。 


#include <stdio.h> 


FILE *popen (const char *cmdstring, const char *type) ; 


返回 值 : 车 成 功 则 返回 文件 指针 ， 若 出 错 则 返回 NULL 
int pclose(FILE *fp); 
返回 值 ， cmdstrin8 的 终止 状态 ， 若 出 错 则 返回 ~1 





国 数 popen 先 执行 Eork,， 然 后 调用 exec 以 执行 cmdstring, 并 且 返 回 一 个 标准 IO 文件 指针 。 
如 果 type 是 "r"， 则 文件 指针 连接 到 cmdstring 的 标准 输出 ( 见 图 15-5)。 


父 进程 cmdstring (FHF) 
图 15-5 执行 fp = popen (cmdstring，"r") 函 数 的 结果 


如 果 type 是 "w"， 则 文件 指针 连接 到 cmdstring 的 标准 输入 ( 见 图 15-6)。 
父 进 各 cmdstring ( 子 进程 ) 


= 
图 15-6 执行 fp = popen(cmdstring，"w") 函 数 的 结果 


有 一 种 方法 可 以 帮助 我 们 记 住 popen 最 后 一 个 参数 及 其 作用 ， 这 就 是 与 fopen 进 行 类 比 。 如 果 
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type 是 “r”, 则 返回 的 文件 指针 是 可 读 的 ， 如 果 type 是 “w”， 则 是 可 写 的 。 

pclose 消 数 关闭 标准 1/O 流 ， 等 待命 令 执 行 结束 ， 然 后 返回 shell 的 终 赴 状态 。( 我 们 曾 在 
8.6 节 对 终止 状态 进行 过 说 明 ，system 国 数 ( 见 8.13 节 ) 也 返回 终 下 状态。 ) 如 果 shell 不 能 被 执 
fi, Wipclosesk BAIS ib RAS Sshell Bh fTexit (127) 一 样 。 

cmdstring Bourne shell 以 下 列 方式 执行 

sh -c cmdstring 

这 表示 shell 将 扩展 crmmdstring 中 的 任何 特殊 字符 。 例 如 ， 可 以 使 用 

fp = popen("ls *.c", "r"); 


或 者 


fp = popen("cmd 2>&1", "r"); 








用 popen 重 写 程序 清单 153-2， 其 结果 示 于 程序 清单 15-4 中 。 
程序 清单 15-4 用 popen 向 分 页 程序 传送 文件 


#include "apue.h" 
#include «sys/wait.h» 


#define PAGER "${PAGER:-more}" /* environment variable, or default */ 


int 
main(int argc, char *argv[]) 


char line [MAXLINE] ; 
FILE *fpin, *fpout; 


if (argc != 2) 
err quit("usage: a.out «pathname»"); 
if ((fpin - fopen(argv[1], "r")) -- NULL) 
err_sys ("can't open $s", argv[1]); 


if ((fpout - popen(PAGER, "w")) -- NULL) 
err_sys("popen error"); 


/* copy argv[1] to pager */ 
while (fgets(line, MAXLINE, fpin) !- NULL) ( 
if (fputs(line, fpout) == EOF) 
err_sys("fputs error to pipe"); 


if (ferror(fpin) ) 
err_sys ("fgets error"); 
if (pclose(fpout) == -1) 
err_sys("pclose error"); 


exit (0); 


} 





使 用 popen 减 少 了 需要 编写 的 代码 量 。 
shell 命 令 $ (PAGER: -more} 的 意思 是 ; 如果 shell 变 量 PAGER 已 经 定义 ， 且 其 值 非 空 ， 则 使 
用 其 值 ， 否 则 使 用 字符 串 more。 Cl 


: bbs.theithome.com 


15.3 popenfepclosedy 





实例 : popen 和 pclose 函 数 
程序 清单 15-5 是 我 们 编写 的 popen 和 pclose 版 本 。 
程序 清单 15-5 popen 和 pclose 函 数 





#include "apue.h" 
#include <errno.h> 
#include «fcntl.h» 
Hinclude «sys/wait.h» 


/* 
* Pointer to array allocated at run-time. 
=f, 
static pid t *childpid = NULL; 
/* 
* From our open max(), Figure 2.16. 
*/ 
Static int maxfd; 
FILE * 
popen(const char *cmdstring, const char *type) 
{ 
int i; 
int pfd[2] ; 
pid t pid; 


FILE *fp; 


/* only allow "r" or "w" */ 


if ((type[0] !- 'r' && type[0] != 'w') || typel1] != 0) { 
errno = EINVAL; /* required by POSIX */ 
return (NULL) ; 
} 
if (childpid == NULL) { /* first time through */ 
/* allocate zeroed out array for child pids */ 
maxfd = open_max(); 
if ((childpid = calloc(maxfd, sizeof (pid_t))) == NULL) 
return (NULL) ; 
} 


if (pipe(pfd) < 0) 
return (NULL) ; /* errno set by pipe() */ 


if ((pid = fork()) < 0) { 
return (NULL) ; /* errno set by fork() */ 
} else if (pid == 0) { /* child */ 
if (*type == ‘r’) { 
close (pfd[0]) ; 
if (pfd[1] != STDOUT FILENO) { 
dup2(pfd[1], STDOUT _FILENO) ; 
close (pfd[1]1); 


} else { 
close (pfd[1]) ; 
if (pfd[O] !- STDIN FILENO) ( 
dup2(pfd[0], STDIN FILENO); 
close (pfd[0]); 
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/* close all descriptors in childpid[] */ 
for (i = 0; i « maxfd; i++) 
if (childpid[i] > 0) 
close (i); 


execl("/bin/sh", "sh", "-c", cmdstring, (char *)0); 
_exit (127) ; 


} 


/* parent continues... */ 
if (*type == 'r') { 
close (pfd[1]); 
if ((fp = fdopen(pfd[0], type)) == NULL) 
] return (NULL); 
) else { 
close (pfd[0]); 
if ((fp = fdopen(pfd[1], type)) == NULL) 
return (NULL) ; 


} 


childpid[fileno(fp)} = pid; /* remember child pid for this fd */ 
return(fp); 

) 

int 

pclose(FILE *fp) 


{ 


int fd, stat; 
pid t pid; 


if (childpid == NULL) { 
errno - EINVAL; 
return(-1); /* popen() has never been called */ 


} 


fd = fileno(fp); 
if ((pid = childpid[fd]) == 0) { 
errno = EINVAL; 
return(-1); /* fp wasn't opened by popen() */ 


) 


childpid[fd] - 0; 
if (fclose(fp) -- EOF) 
return(-1); 


while (waitpid(pid, &stat, 0) « 0) 
if (errno !- EINTR) 
return(-1); /* error other than EINTR from waitpid() */ 


return(stat); /* return child's termination status */ 


} 


虽然 popen 的 核心 部 分 与 本 章 中 以 前 用 过 的 代码 类 似 ， 但 是 增加 了 很 多 需要 考虑 的 细节 。 
首先 ， 每 次 调用 pepen 时 ， 应 当 记 住所 创建 的 子 进程 的 进程 ID ， 以 及 其 文件 描述 符 或 FILE 指 
针 。 我 们 选择 在 数组 chi1dpid 中 保存 子 进程 ID ， 并 用 文件 描述 符 作为 其 下 标 。 于 是 ， 当 以 
FILE 指 针 作为 参数 调用 pclose 了 时， 我 们 调用 标准 VO 函数 fileno 得 到 文件 描述 符 ， 然 后 取得 
子 进程 ID， 并 用 其 作为 参数 调用 waitpid。 因 为 一 个 进程 可 能 调用 popen 多 次 ， 所 以 在 动态 分 
配 childpid 数 组 时 (第 一 次 调用 popen 时 )， 其 数组 长 度 应 当 是 最 大 文件 描述 符 数 ， 于 是 该 
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数组 中 可 以 存放 与 最 大 文件 描述 符 数 相同 的 子 进程 。 

调用 pipe、fork 以 及 为 每 个 进程 复制 相应 的 文件 描述 符 ， 这 些 操作 与 本 章 前 面 所 述 的 
类 似 。 

POSIX.1 要 求 子 进程 关闭 在 以 前 调用 popen 时 打开 且 当 前 仍旧 打开 的 所 有 LO 流 。 为 此 ,在 
子 进程 中 从 头 逐 个 检查 childpiad 数 组 的 各 元 素 ， 关 闭 仍旧 打开 的 任何 描述 符 。 

若 bclose 的 调用 者 已 经 为 信号 SIGCHLD 设 置 了 一 个 信号 处 理 程序 ， 则 Pclose 中 的 
waitpidq 调 用 将 返回 一 个 EINTR。 因 为 允许 调用 者 捕捉 此 信号 (或 者 任何 其 他 可 能 中 断 wai copia 
调用 的 信号 ) ， 所 以 当 waitpid 被 -一 个 捕捉 到 的 信号 中 断 时 ， 我 们 只 是 再 次 调用 waitpia。 

注意 ， 如 果 应 用 程序 调用 wai tpid， 并且 获得 popen 所 创建 的 子 进程 的 终止 状态 ， 则 在 应 
用 程序 调用 pclose 时 ， 其 中 将 调用 waitpida， 它 发 现 子 进程 已 不 再 存在 ， 此 时 返回 一 1， 
errno 则 被 设置 为 ECHILD。 这 正 是 POSIX.1 所 要 求 的 。 


如 果 一 个 信号 中 断 了 wait，pclose 的 早期 版 本 返回 EINTR。pclose 的 早期 版 本 在 wait 期 间 阻 宕 
载 息 略 信 号 SIGINT、SIGQUIT 以 及 SIGHUP。POSIX.1 则 不 允许 这 一 点 。 


口 
注意 ，popen 决 不 应 由 设置 用 户 ID 或 设置 组 ID 程序 调用 。 当 它 执 行 命令 时 ，popen 等 同 于 : 


execl("/bin/sh", "sh", "-c", command, NULL); 
它 在 从 调用 者 继承 的 环境 中 执行 shell， 并 由 shell 解 释 执 行 command。 一 个 心怀 不 轨 的 用 户 可 以 
操纵 这 种 环境 ， 使 得 shell 能 以 设置 ID 文 件 模式 所 授与 的 提升 了 的 权限 以 及 非 预 期 的 方式 执行 
命令 。 

popen 特 别 适用 于 构造 简单 的 过 滤器 程序 ， 它 变换 运行 命令 的 输入 或 输出 。 当 命令 希望 构 
造 它 自己 的 管道 线 时 ， 就 是 这 种 情形 。 


实 例 
考虑 一 个 应 用 程序 ， 它 向 标准 输出 写 一 个 提示 ， 然 后 从 标准 输入 读 1 行 。 使 用 popen， 可 


以 在 应 用 程序 和 输入 之 间 揪 入 一 个 程序 以 便 对 输入 进行 变换 处 理 。 图 15-7 显 示 了 为 此 做 的 进程 
安排 。 





stdout 





图 15-7 用 popen 对 输入 进行 变换 处 理 
对 输入 进行 的 变换 可 能 是 路 径 名 扩充 ， 或 者 是 提供 一 种 历史 机 制 〈 记 住 以 前 输入 的 命令 )。 
程序 清单 15-6 是 一 个 简单 的 过 滤 程 序 ， 它 只 是 将 标准 输入 复制 到 标准 输出 ， 在 复制 时 将 所 
有 大 写字 符 变换 为 小 写字 符 。 在 写 了 一 行 之 后 ， 对 标准 输出 进行 了 冲洗 (用 fflush)， 其 理由 
将 在 下 一 节 介 绍 协同 进程 时 讨论 。 
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程序 清单 15-6 ”将 大 写字 符 换 成 小 写字 符 的 过 滤 程 序 


#include "apue.h" 
#include <ctype.h> 


int 
main (void) 


int C; 


while ((c = getchar()) != EOF) { 
if (isupper(c)) 
C = tolower(c); 
if (putchar(c) == EOF) 
err sys("output error"); 
if (c == '\n') 
fflush(stdout); 
) 
exit(0); 


) 


对 该 过 滤 程 序 进行 编译 ， 其 可 执行 目标 代码 存放 在 文件 nyuc1lc 中 ， 然 后 在 程序 清单 15-7 
中 用 popen 调 用 它们 。 
程序 清单 15-7 ”调用 大 写 / 小 写 过 滤 程 序 以 读 取 命令 


#include "apue.h" 
#include «sys/wait.h» 





int 
main (void) 


char line (MAXLINE] ; 
FILE *fpin; 


if ((fpin = popen("myuclc", "r")) zz NULL) 
err Sys("popen error"); 
for (;; ) 


fputs("prompt» ", stdout) ; 
fflush (stdout) ; 


if (fgets(line, MAXLINE, fpin) == NULL) /* read from pipe */ 
break; 
if (fputs(line, stdout) == EOF) 


err_sys("fputs error to pipe"); 
} 
if (pclose(fpin) == -1) 
err sys("pclose error"); 
putchar (‘\n’'); 
exit(0); 


) 


因为 标准 输出 通常 是 行 缓冲 的 ， 而 提示 并 不 包含 换行 符 ， 所 以 在 写 了 提示 之 后 ， 需 要 调用 
fflush, D 


15.4 协同 进程 
UNIX 系 统 过 滤 程 序 从 标准 输入 读 取 数 据 ， 对 其 进行 适当 处 理 后 写 到 标准 输出 。 几 个 过 波 
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程序 通常 在 shell 管 道 命 令 行 中 线性 地 连接 。 当 一 个 程序 产生 某 个 过 滤 程 序 的 输入 ， 同 时 又 读 取 
该 过 滤 程 序 的 输出 时 ， 则 该 过 滤 程 序 就 成 为 协同 进程 (coprocess)。 

Korn shell 提 供 了 协同 进程 [Bolsky and Korn 1995]。Bourne shell、Bourne-again shell 和 C 
shell 并 没有 提供 按 协 同 进程 方式 将 进程 连接 起 来 的 方法 。 协 同 进程 通常 在 shell 的 后 台 运行 ， 其 
标准 输入 和 标准 输出 通过 管道 连接 到 另 一 个 程序 。 虽 然 初始 化 一 个 协同 进程 并 将 其 输入 和 输出 
连接 到 另 一 个 进程 ， 用 到 的 shell 语 法 是 十 分 奇特 的 (详细 情况 见 Bolsky 和 Korn[1995] 中 的 第 
62~63 页 ) ， 但 是 协同 进程 的 工作 方式 在 C 程 序 中 也 是 非常 有 用 的 。 

popen 只 提供 连接 到 另 一 个 进程 的 标准 输入 或 标准 输出 的 一 个 单 向 管道 , 而 对 于 协同 进程 ， 
则 它 有 连接 到 另 一 个 进程 的 两 个 单 向 管道 一 一 一 个 接 到 其 标准 输入 ， 另 一 个 则 来 自 其 标准 输出 。 
我 们 先 要 将 数据 写 到 其 标准 输入 ， 经 其 处 理 后 ， 再 从 其 标准 输出 读 取 数据 。 





让 我 们 通过 一 个 实例 来 观察 协同 进程 。 进 程 先 创建 两 个 管道 : 一 个 是 协同 进程 的 标准 输入 ， 
另 一 个 是 协同 进程 的 标准 输出 。 图 15-8 显 示 了 这 种 安排 。 


父 进程 子 进程 协同 进程 ) 
管道 
Edl [1] 
管道 2 
图 15-8 写 协同 进程 的 标准 输入 ， 读 它 的 标准 输出 


程序 清单 15-8 程 序 是 一 个 简单 的 协同 进程 ， 它 从 其 标准 输入 读 两 个 数 ， 计 算 它们 的 和 ， 然 
后 将 结果 写 至 标准 输出 。( 协 同 进程 通常 会 做 较 此 更 有 意义 的 工作 。 设 计 本 实例 的 目的 是 帮助 
了 解 将 进程 连接 起 来 所 需 的 各 种 管道 设施 。) 


程序 清单 15-8 对 两 个 数 求 和 的 简单 过 滤 程 序 


CA 
= 
e 


#include "apue .hn 
int 
main (void) 


int n, inti, int2; 
char line [MAXLINE] ; 


while ((n = read(STDIN FILENO, line, MAXLINE)) > 0) { 
line[n] = 0; /* null terminate */ 
if (sscanf(line, "%d%d", &int1, &int2) == 2) { 
sprintf (line, "$dWMn", intl + int2); 
n = strlen(line) ; 
if (write (STDOUT_FILENO, line, n) != n) 
err_sys ("write error"); 
} else { 
if (write(STDOUT FILENO, "invalid args\n", 13) != 13) 
err_sys("write error") ; 


} 


exit (0); 
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对 此 程序 进行 编译 ， 将 其 可 执行 目标 代码 存 人 名 为 a992 的 文件 。 
程序 清单 15-9 从 其 标准 输入 读 入 两 个 数 之 后 调用 ada2 协 同 进程 ， 并 将 协同 进程 送 来 的 值 写 
到 其 标准 输出 。 
程序 清单 15-9 驱动 ada2 过 滤 程 序 的 程序 


#include "apue .hn 


static void sig pipe(int); /* our signal handler */ 
int 
main(void) 
{ 
int n, fdi[2], fd2[2]; 
pid t pid; 


char line [MAXLINE] ; 


if (signal(SIGPIPE, sig pipe) == SIG ERR) 
err sys("signal error"); 


if (pipe(fd1) < 0 || pipe(fd2) < 0) 
err_sys ("pipe error"); 


if ((pid = fork()) < 0) { 
err_sys ("fork error"); 
} else if (pid > 0) { /* parent */ 
close (fd1[0]); 
close (fd2[1]); 
while (fgets(line, MAXLINE, stdin) != NULL) { 
n = strlen(line) ; 
if (write(fdl[1], line, n) != n) 
err_sys ("write error to pipe"); 
if ((n = read(fd2[0], line, MAXLINE)) < 0) 
err_sys ("read error from pipe"); 
if (n == 0) { 
err_msg("child closed pipe") ; 
break; 
} 
line[n] = 0; /* null terminate */ 
if (fputs(line, stdout) -- EOF) 
err SyS("fputs error"); 


) 


if (ferror(stdin)) 
err_sys ("fgets error on stdin"); 

exit(0); 

) eise ( /* child */ 

close(fdi[11); 

close (fdq2 [0] ) ; 

if (fdi[0] !- STDIN FILENO) { 
if (dup2(fd1[0], STDIN FILENO) !- STDIN FILENO) 

err SyS("dup2 error to stdin"); 

close(fd1i[0]); 

} 


if (fd2[1] != STDOUT_FILENO) { 
if (dup2(fd2[1], STDOUT FILENO) != STDOUT FILENO) 
err SyS("dup2 error to stdout"); 
close(fd2[1]); 


if (execl("./add2", "add2", (char *)0) < 0) 
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err sys("execl error"); 


) 


exit(0); 


) 


static void 
sig pipe(int signo) 


printf("SIGPIPE caught\n") ; 
exit (1); 


} 


在 程序 中 创建 了 两 个 管道 ， 父 、 子 进程 各 自 关闭 它们 不 需 使 用 的 端口 。 两 个 管道 一 个 用 做 


协同 进程 的 标准 输入 ， 另 一 个 则 用 做 它 的 标准 输出 。 子 进程 调用 aup2 使 管道 描述 符 移 至 其 标 
准 输入 和 标准 输出 ， 然 后 调用 exec1l。 

若 编译 和 运行 程序 清单 15-9 程 序 ， 它 如 所 希望 的 那样 进行 工作 。 进 而 言 之 ， 在 程序 正 等 待 
输入 时 ， 若 先 杀 死 add2 协 同 进程 ， 然 后 输入 两 个 数 ， 接 着 程序 对 管道 进行 写 操作 ， 此 时 ， 由 
于 该 管道 已 无 读 进程 ， 于 是 调用 信和 号 处 理 程序 (见习 题 15.4)。 

回忆 表 15-1， 并 非 所 有 系统 用 pipe 国 数 提供 全 双 工 管道 。 程 序 清单 17-1 将 提供 这 一 实 
例 的 另 一 个 版 本 ， 它 使 用 一 个 全 双 工 管道 而 不 是 两 个 半 双 工 管道 ， 适 用 于 支持 全 双 工 管道 的 
系统 。 口 








在 协同 进程 ada2 ( 见 程序 清单 15-8) 中 ， 有 意 地 使 用 了 read 和 writel/O (UNIX 系 统 
调用 ) 。 如 果 使 用 标准 IO 改写 该 协同 进程 ， 其 后 果 是 什么 呢 ? 程序 清单 15-10 就 是 改写 后 的 
版 本 。 


程序 清单 15-10 对 两 个 数 求 和 的 滤波 程序 ， 使 用 标准 MO 
#include "apue .hn 


int 
main (void) 


int intl, int2; 
char line [MAXLINE] ; 


while (fgets(line, MAXLINE, stdin) != NULL) { 
if (sscanf (line, "$d&d", &int1, &int2) == 2) { 
if (printf ("%d\n", intl + int2) == EOF) 
err_sys("printf error"); 
} else { 
if (printf ("invalid args\n") == EOF) 
err sys("printf error"); 
) 
) 
exit(0); 


) 


若 程序 清单 15-9 调 用 此 新 的 协同 进程 ， 则 它 不 再 工作 。 问 题 出 在 系统 默认 的 标准 MO 缓冲 机 


制 上 。 当 调用 程序 清单 15-10 所 示 程 序 时 ， 对 标准 输入 的 第 一 个 fgets 引 起 标准 IO 库 分 配 一 个 
缓冲 区 , 并 选择 缓冲 区 的 类 型 。 因 为 标准 输入 是 个 管道 ， 所 以 标准 VO 库 由 系统 默认 是 全 缓冲 的 。 
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对 标准 输出 也 作 同 样 的 处 理 。 当 adad2 从 其 标准 输入 读 取 而 发 生 阻 塞 时， 程序 清 单 15-9 程 序 从 管 
道 读 时 也 发 生 阻 塞 ， 于 是 产生 了 死 锁 。 

为 此 ， 更 改 将 要 运行 的 协同 进程 的 缓冲 类 型 ， 在 程序 清单 15-10 中 的 whi le 循环 之 前 加 上 
下 面 4 行 : 


if {setvbuf (stdin, NULL, _IOLBF, 0) != 0) 
err_sys("setvbuf error") ; 
if (setvbuf (stdout, NULL,  IOLBF, 0) != 0) 


err sys("setvbuf error"); 


这 些 代码 行使 得 当 有 一 行 可 用 时 ，fgets 就 返回 ， 并 使 得 当 输 出 一 换行 符 时 ，printf 立 即 执 
行 fflush 操 作 。 对 setvbuf 进 行 的 这 些 显 式 调用 使 得 程序 15-10 能 正常 工作 。 

如 果 不 能 修改 这 种 协同 进程 程序 ， 则 需 使 用 其 他 技术 。 例 如 ， 如 果 在 程序 中 使 用 awk(D 代 
替 add2 作 为 协同 进程 ， 则 下 列 命令 行 不 能 工作 ， 

#! /bin/awk -f 

{ print $1 + $2 } 

不 能 工作 的 原因 还 是 标准 MO 的 缓冲 机 制 问题 。 但 是 ， 在 这 种 情况 下 不 能 改变 awk 的 工作 方 
式 (除非 有 awk 的 源 代码 )。 我 们 不 能 修改 awk 的 可 执行 代码 ， 于 是 也 就 不 能 更 改 处 理 其 标准 
IO 缓冲 的 方式 。 

对 这 种 问题 的 一 般 解 决 方法 是 使 被 调用 的 协同 进程 (在 本 例 中 是 awk) 认为 它 的 标准 输入 
和 输出 都 被 连接 到 一 个 终端 。 这 使 得 协同 进程 中 的 标准 MO 例 程 对 这 两 个 1O 流 进行 行 缓冲 ， 这 
类 似 于 前 面 所 做 的 显 式 sectvbuf 调 用 。 第 19 章 将 用 伪 终端 实现 这 一 点 。 口 


15.5 FIFO 


FIFO 有 时 被 称 为 命名 管道 。 管 道 只 能 由 相关 进程 使 用 ， 这 些 相 关 进 程 的 共同 的 祖先 进程 创 
建 了 管道 。( 一 个 例外 是 已 装配 的 基于 STREAMS 的 管道 ， 我 们 将 在 17.2.2 中 对 此 进行 说 明 。) 但 
是 ， 通 过 FIFO， 不 相关 的 进程 也 能 交换 数据 。 

第 4 章 中 已 经 提 及 FIFO 是 一 种 文件 类 型 。stat 结 构 ( 见 4.2 节 ) 成 员 st_mode 的 编码 指明 
文件 是 否 是 FIFO 类 型 。 可 以 用 s_ISFIFO 宏 对 此 进行 测试 。 

创建 FIFO 类 似 于 创建 文件 。 确 实 ，FIFO 的 路 径 名 存在 于 文件 系统 中 。 


#include <sys/stat.h> 


int mkfifo(const char *pathname, mode_t mode) ; 


返回 值 : 若 成 功 则 返回 09， 车 出 错 则 返回 一 1 





mkfifo 国 数 中 mode 参 数 的 规格 说 明 与 cpen 函 数 中 的 mode 相 同 ( 见 3.3 节 )。 新 FIFO 的 用 户 和 
组 的 所 有 权 规 则 与 4.6 节 所 述 的 相同 。 

- 旦 已 经 用 mkfifo 创 建 了 一 个 FIFO， 就 可 用 open 打 开 它 。 其 实 ， 一 般 的 文件 WO 函数 
(close, read, write, unlink/£) 都 可 用 于 FIFO。 


应 用 程序 可 以 用 mknod 肖 数 创建 FIFO。POSIX.1 原 先 并 没有 包括 mknod 辑 数 、 它 首先 提出 了 
mkfifo。mknod 现 在 已 包括 在 XSI 扩 展 中 。 在 大 多 数 系统 中 ，mkfifo 调 用 mkmod 创 建 FIFO。 
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POSIX.1 也 ,包括 了 对 mkfifo(l) 命 令 的 支持 。 本 书 讨论 的 四 种 平台 都 支持 此 命令 。 于 是 ， 用 一 条 
shell 命 令 就 可 以 创建 一 个 FIFO， 然 后 用 一 般 的 shell W/O 重 定向 对 其 进行 访问 。 


当 打 开 一 个 FIFO 时 ， 非 阻塞 标志 (O NONBLOCK) 产生 下 列 影响 : 

。 在 一 般 情 况 中 (没有 指定 O_NONBLOCK) ， 只 读 cpen 要 阻塞 到 某 个 其 他 进程 为 写 而 打开 

此 FIFO。 类 似 地 ， 只 写 open 要 阻塞 到 某 个 其 他 进程 为 读 而 打开 它 。 

。 如 果 指 定 了 0_NONBLOCK， 则 只 读 open 立 即 返 回 。 但 是 ， 如 果 没 有 进程 已 经 为 读 而 打开 

一 个 FIFO， 那 么 只 写 open 将 出 错 返 回 -1， 其 errno 是 ENXIO。 
类 似 于 管道 ， 若 用 write 写 一 个 尚 无 进程 为 读 而 打开 的 FIFO， 则 产生 信号 STIGPIPE。 若 某 个 
FIFO 的 最 后 一 个 写 进程 关闭 了 该 FIFO， 则 将 为 该 FIFO 的 读 进 程 产生 一 个 文件 结束 标志 。 

一 个 给 定 的 FIFO 有 多 个 写 进程 是 很 常见 的 。 这 就 意味 着 如 果 不 希 望 多 个 进程 所 写 的 数据 互 
相 穿 插 ， 则 需 考 虑 原子 写 操 作 。( 在 17.2.2 节 中 将 说 明 解决 此 问题 的 一 种 方法 。) 正如 对 于 管道 
一 样 ， 常 量 PIPE_BUF 说 明了 可 被 原子 地 写 到 FIFO 的 最 大 数据 量 。 

FIFO 有 下 面 两 种 用 途 : 

(1) FIFO 由 shell 命 令 使 用 以 便 将 数据 从 一 条 管道 线 传送 到 另 一 条 ， 为 此 无 需 创 建 中 间 痢 时 
文件 。 

(2) FIFO 用 于 客户 进程 -服务 器 进程 应 用 程序 中 ， 以 在 客户 进程 和 服务 器 进程 之 间 传 递 数 据 。 
我 们 各 用 一 个 例子 来 说 明 这 两 种 用 途 。 


实例 ， 用 FIFO 复 制 给 出 流 


FIFO 可 被 用 于 复制 串 行 管道 命令 之 间 的 输出 流 ， 于 是 也 就 不 需要 写 数据 到 中 间 磁 盘 文件 中 
(类 似 于 使 用 管道 以 避免 中 间 磁 盘 文 件 ) 。 管 道 只 能 用 于 进程 间 的 线性 连接 ， 然 而 ， 因 为 FIFO 具 
有 名 字 ， 所 以 它 可 用 于 非 线 性 连接 。 

考虑 这 样 一 个 操作 过 程 ， 它 需要 对 一 个 经 过 过 滤 的 输入 流 进行 两 次 处 理 。 图 15-9 表 示 了 这 
种 安排 。 


输入 
文件 





图 15-9 ”对 一 个 经 过 过 让 的 输入 流 进行 两 次 处 理 


使 用 FIFO 以 及 UNIX 系 统 程序 ee(1D)， 就 可 以 实现 这 样 的 过 程 而 无 需 使 用 临时 文件 。(tee 
程序 将 其 标准 输入 同时 复制 到 其 标准 输出 以 及 其 命令 行 中 包含 的 命名 文件 中 。) 


mkfifo fifol 
prog3 < fifol & 
progi < infile | tee fifol | prog2 


我 们 创建 FIFO ， 然 后 在 后 台 启 动 prog3 ， 它 从 FIFO 读 数据 。 然 后 启动 prog1， 用 tee 将 其 输出 
发 送 到 FIFO 和 prog2。 图 15-10 显 示 了 有 关 安 排 。 
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图 15-10 使 用 FIFO 和 tee 将 一 个 流 发 送 到 两 个 进程 口 


实例 :客户 进程 一 服务 器 进程 使 用 FIFO 进 行 通信 


FIFO 的 另 一 个 应 用 是 在 客户 进程 和 服务 器 进程 之 间 传送 数据 。 如 果 有 一 个 服务 器 进程 ， 它 
与 很 多 客户 进程 有 关 ， 则 每 个 客户 进程 都 可 将 其 请 求 写 到 一 个 该 服务 器 进程 创建 的 众所周知 的 
FIFO 中 (“众所周知 ”的 意思 是 : 所 有 需 与 服务 器 进程 联系 的 客户 进程 都 知道 该 FIFO 的 路 径 名 ) , 
图 15-11 显 示 了 这 种 安排 。 因 为 对 于 该 FIFO 有 多 个 写 进程 ， 客 户 进 程 发 送 给 服务 器 进程 的 请 求 
其 长 度 要 小 于 PIPE_BUF 字 节 。 这 样 就 能 避免 客户 多 个 write 之 间 的 交错 。 

在 这 种 类 型 的 客户 进程 -服务 器 进程 通信 中 使 用 FIFO 的 问题 是 : 服务 器 进程 如 何 将 回答 送 
回 各 个 客户 进程 。 不 能 使 用 单个 FIFO， 因 为 服务 器 进程 会 发 出 对 各 个 客户 进程 请 求 的 响应 ， 而 
请 求 者 却 不 可 能 知道 什么 时 候 去 读 才 能 恰如其分 地 读 到 对 它 的 响应 。 一 种 解决 方法 是 每 个 客户 
进程 都 在 其 请 求 中 包含 它 的 进程 ID。 然 后 服务 器 进程 为 每 个 客户 进程 创建 一 个 FIFO， 所 使 用 的 
路 径 名 是 以 客户 进程 的 进程 ID 为 基础 的 。 例 如 ， 服 务 器 进程 可 以 用 名 字 / tmp/ serv1 .XXXXX 
创建 FIFO， 其 中 XXXXX 被 替换 成 客户 进程 的 进程 ID。 图 15-12 显 示 了 这 种 安排 。 





图 15-11 客户 进程 用 FIFO 向 图 15-12 客户 进程 -服务 器 进程 用 FIFO 进 行 通信 
服务 器 进程 发 送 请 求 


这 种 安排 可 以 工作 ,但 也 有 一 些 不 足 之 处 。 其 中 之 一 是 服务 器 进程 不 能 判断 一 个 客户 进程 
是 否 崩溃 终止 ， 这 就 使 得 客户 进程 专用 的 FIFO 会 遗留 在 文件 系统 中 。 另 一 个 不 足 之 处 是 服务 器 
进程 必须 捕捉 STGPIPE 信 号 ， 因 为 客户 进程 在 发 送 一 个 请 求 后 没有 读 取 响应 就 可 能 终止 ， 于 是 
留 下 一 个 只 有 写 进程 (服务 器 进程 ) 而 无 读 进程 的 客户 进程 专用 FIFO。 在 17.2.2 节 中 我 们 将 讨 
论 已 装配 的 基于 STREAMS 的 管道 以 及 conn1a， 那 时 会 说 明 解决 此 种 问题 更 加 妥善 的 方法 。 

按照 图 15-12 中 的 安排 ， 如 果 服务 器 进程 以 只 读 方式 打开 众所周知 的 FIFO (因为 它 只 需 读 
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该 FIFO)， 则 每 当 客户 进程 数 从 1 变 成 O 时 ， 服 务 器 进程 就 将 在 FIFO 中 读 到 一 个 文件 结束 标记 。 
为 使 服务 器 进程 免 于 处 理 这 种 情况 ， 一 种 常用 的 技巧 是 使 服务 器 进程 以 读 一 写 方式 打开 其 FIFO 
(见习 题 15.10) 。 口 


15.6 XSI IPC 


有 三 种 IPC 我 们 称 作 XSI IPFC， 即 消息 队列 、 信 和 号 量 以 及 共享 存储 器 ， 它 们 之 间 有 很 多 相似 
之 处 。 以 下 各 节 将 说 明 这 些 IPC 的 各 自 特殊 功能 ， 本 节 先 介绍 它们 相 类 似 的 特征 。 


XSI IPC 源 自 系统 V 的 IPC 功 能 ， 二 者 密切 相关 。 后 者 源 自 于 1970 年 的 一 种 称 为 Columbus UNIX 的 
AT&T 内 部 版 本 ， 后 来 它们 被 加 到 系统 V 上 。 由 于 XSI IPC 不 使 用 文件 系统 名 字 空 间 、 而 是 构造 了 它们 
自己 的 名 字 空 间 ， 为 此 常常 受到 批评 。 

回忆 表 15-1， 消息 队列 、 信 号 量 及 共享 存储 器 定义 在 Single UNIX Specification 的 XSI 扩 展 中 。 


15.6.1 标识 符 和 键 


每 个 内 核 中 的 IPC 结 构 (消息 队列 、 信 号 量 或 共享 存储 段 ) 都 用 一 个 非 负 整数 的 标识 符 
(identifier) 加 以 引用 。 例 如 ， 为 了 对 一 个 消息 队列 发 送 或 取消 息 ， 只 需要 知道 其 队列 标识 符 。 
与 文件 描述 符 不 同 ，IPC 标 识 符 不 是 小 的 整数 。 当 一 个 了 PC 结构 被 创建 ， 以 后 又 被 删除 时 ， 与 这 
种 结构 相关 的 标识 符 连 续 加 1， 直 至 达到 一 个 整 型 数 的 最 大 正 值 ， 然 后 又 回转 到 0。 

标识 符 是 IPC 对 象 的 内 部 名 。 为 使 多 个 合作 进程 能 够 在 同一 IPC 对 象 上 会 合 ， 需 要 提供 一 个 
外 部 名 方案 。 为 此 使 用 了 键 (key) ， 每 个 IPC 对 象 都 与 一 个 键 相 关联 ， 于 是 键 就 用 作为 该 对 象 
的 外 部 名 。 

无 论 何 时 创建 IPC 结 构 (调用 msgget、semget 或 shmget) ,都 应 指定 一 个 键 ， 键 的 数据 
类 型 是 基本 系统 数据 类 型 key_ 七 ， 通 常 在 头 文件 <sys/types.h> 中 被 定义 为 长 整 型 。 键 由 内 
核 变 换 成 标识 符 。 

有 多 种 方法 使 客户 进程 和 服务 器 进程 在 同一 IPC 结 构 上 会 合 : 

(1) 服务 器 进程 可 以 指定 键 IPC_PRIVRATE 创 建 - .个 新 IPC 结 构 ， 将 返回 的 标识 符 存放 在 基 
处 〈 例 如 一 个 文件 ) 以 便 客户 进程 取 用 。 键 IPC_PRIVATE 保 证 服务 器 进程 创建 一 个 新 IPC 结 构 。 
这 种 技术 的 缺点 是 : 服务 器 进程 要 将 整 型 标识 符 写 到 文件 中 ， 此 后 客户 进程 又 要 读 文件 取得 此 
标识 符 。 

IPC_PRIVATE 键 也 可 用 于 父 、 子 进程 关系 。 父 进程 指定 IPC_PRIVATE 创 建 一 个 新 IPC 结 
构 ， 所 返回 的 标识 符 在 调用 fork 后 可 由 子 进程 使 用 。 接 着 ， 子 进程 又 可 将 此 标识 符 作为 exec 
函数 的 一 个 参数 传 给 一 个 新 程序 。 

(2) 在 一 个 公用 头 文件 中 定义 一 个 客户 进程 和 服务 器 进程 都 认可 的 键 。 然 后 服务 器 进程 指 
定 此 键 创 建 一 个 新 的 IPC 结 构 。 这 种 方法 的 问题 是 该 键 可 能 已 与 一 个 IPC 结 构 相 结合 ， 在 此 情况 
下 ，get 函 数 (msgget、semget 或 shmget) 出 错 返 回 。 服 务 器 进程 必须 处 理 这 一 错误 ， 删 
除 已 存在 的 IPC 结 构 ， 然 后 试 着 再 创建 它 。 

(3) 客户 进程 和 服务 器 进程 认同 一 个 路 径 名 和 项 目 ID (项 目 ID 是 0~255 之 间 的 字符 值 ) d 
着 调用 函数 Etok 将 这 两 个 值 变换 为 一 个 键 。 然 后 在 方法 (2) 中 使 用 此 键 。ftok 提 供 的 唯一 服务 
就 是 由 一 个 路 径 名 和 项 目 ID 产生 一 个 键 。 
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#include <sys/ipc.h> 


key t ftok(const char *path, int id); 


返回 值 ， 若 成 功 则 返回 键 ， 若 出 错 则 返回 (key_t)-1 





Path 参 数 必须 引用 一 个 现存 文件 。 当 产生 键 时 ， 只 使 用 id 参 数 的 低 8 位 。 

ftok 创 建 的 键 通常 是 用 下 列 方式 构成 的 ， 按 给 定 的 路 径 名 取得 其 stat 结 构 ( 见 4.2 节 )， 
从 该 结构 中 取出 部 分 st_dev 和 st_ino 字 段 ， 然 后 再 与 项 目 ID 组 合 起 来 。 如 果 两 个 路 径 名 引用 
两 个 不 同 的 文件 ， 那 么 ， 对 这 两 个 路 径 名 调用 ftok 通 常 返回 不 同 的 键 。 但 是 ， 因 为 i 节 点 号 和 
键 通常 都 存放 在 长 整 型 中 ， 于 是 创建 键 时 可 能 会 丢失 信息 。 这 意味 着 ， 如 果 使 用 同一 项 目 ID， 
那么 对 于 不 同文 件 的 两 个 路 径 名 可 能 产生 相同 的 键 。 

三 个 get 函 数 (msgget、semget 和 shmget) 都 有 两 个 类 似 的 参数 : 一 个 key 和 一 个 整 型 
Jag。 如 若 满足 下 列 两 个 条 件 之 一 ， 则 创建 一 个 新 的 IPC 结 构 (通常 由 服务 器 进程 创建 ): 

e Key 是 IPC_PRIVRATE; 

。key 当 前 未 与 特定 类 型 的 IPC 结 构 相 结合 ， 并 且 flag 中 指定 了 IPC_CREAT 位 。 
为 访问 现存 的 队列 (通常 由 客户 进程 进行 )，key 必 须 等 于 创建 该 队列 时 所 指定 的 键 ， 并 且 不 应 
#892 IPC_CREAT, 

注意 ， 为 了 访问 一 个 现存 队列 ， 决 不 能 指定 IPC_PRIVATE 作 为 键 。 因 为 这 是 一 个 特殊 的 
键 值 ， 它 总 是 用 于 创建 一 个 新 队列 。 为 了 访问 一 个 用 IPC_PRIVATE 键 创建 的 现存 队列 ， 一定 
要 知道 与 该 队列 相 结 合 的 标识 符 ， 然 后 在 其 他 IPC 调 用 中 (例如 msgsnd 和 msgrcv) 使 用 该 标 

如 果 和 希望 创建 一 个 新 的 IPC 结 构 , 而 且 要 确保 不 是 引用 具有 同一 标识 符 的 一 个 现行 IPC 结 构 ， 
那么 必须 在 fiag 中 辣 时 指定 IPC_CREAT 和 IPC_EXCL 位 。 这 样 做 了 i 以后， 如果 IPC 结 构 已 经 存 
在 就 会 造成 出 错 ， 返 回 EEXIST (这 与 指定 了 0_CREAT 和 0_EXCL 标 志 的 open 相 类 似 )。 


15.6.2 权限 结构 


XSI IPC 为 每 一 个 IPC 结 构 设置 了 一 个 ipc_perm 结 构 。 该 结构 规定 了 权限 和 所 有 者 。 它 至 
少 包 括 下 列 成 员 : 


struct ipc perm { 
uid t uid; /* owner's effective user id */ 
gid t gid; /* owner's effective group id */ 
uid t cuid; /* creator's effective user id */ 
gid t cgid; /* creator's effective group id */ 
mode t mode; /* access modes */ 


}; 

每 种 实现 在 其 ijpc_perm 结 构 中 会 包括 另外 一 些 成 员 。 如 欲 了 解 你 所 用 系统 中 它 的 完整 定义 ， 
请 参见 <sys/ipc.h>。 

在 创建 了 PC 结构 时 ， 对 所 有 字段 都 赋 初 值 。 以 后 ， 可 以 调用 msgct1、semct1 或 shmct1 
修改 vid、gid 和 mode 字 段 。 为 了 改变 这 些 值 ， 调 用 进程 必须 是 IPC 结 构 的 创建 者 或 超级 用 户 。 
更 改 这 些 字段 类 似 于 对 文件 调用 chown 和 chmod。 

mode 字 段 的 值 类 似 于 表 4-5 中 所 示 的 值 ， 但 是 对 于 任何 IPC 结 构 都 不 存在 执行 权限 。 另 外 ， 
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消息 队列 和 共享 存储 使 用 术语 读 (read) 05 (write) ， 而 信号 量 则 用 术语 读 (rend) MLA 
(alter) 。 表 15-2 中 对 每 种 IPC 说 明了 6 种 权限 。 


表 15-2 XSIIPC 权限 


用 户 读 0400 
APS (更 改 ) 0200 


组 写 GEH) 0020 
其 他 读 0004 
某 些 实现 定义 了 表示 每 种 权限 的 符号 常量 ,但 是 这 些 常量 并 不 包括 在 Single UNIX 
Specification 中 。 


15.6.3 结构 限制 


三 种 形式 的 XSI IPC 都 有 内 置 限制 (built-in limit)。 这 些 限制 的 大 多 数 可 以 通过 重新 配置 内 
核 而 加 以 更 改 。 当 叙说 每 种 PC 时 ， 我 们 都 会 指出 它 的 限制 。 


在 报告 和 修改 限制 方面 、 每 种 平台 都 提供 它 自 己 的 方法 。FreeBSD 52.1, Linux 2.4.22 和 Mac OS 
X 10.3 提 供 了 sysctl 命 令 ， 用 该 命令 观察 和 修改 内 核 配 置 参 数 。Solaris9 修 改 内 核 配 置 参 数 的 方法 是 ， 
修改 文件 /etc/system， 然 后 重启 动 。 

在 Linux 中 ， 你 可 以 运行 ipcs -1 以 显示 IPC 相 关 的 限制 。 在 FreeBSD 中 ， 等 效 的 命令 是 ipcs -T, 
在 Solaris 中 ,运行 SysGef -i 则 可 找到 可 调节 参数 。 





15.6.4 ”优点 和 缺点 


XSI IPC 的 主要 问题 是 : IPC 结 构 是 在 系统 范围 内 起 作用 的 ， 没 有 访问 计数 。 例 如 ， 如 果 进 
程 创 建 了 一 个 消息 队列 ， 在 该 队列 中 放 入 了 几 则 消息 ， 然 后 终止 ,但 是 该 消息 队列 及 其 内 容 并 
不 会 被 删除 。 它 们 余 留 在 系统 中 直至 出 现下 述 情 况 : 由 某 个 进程 调用 msgrcv 或 msgct1 读 消息 
或 删除 消息 队列 ， 或 基 个 进程 执行 ijpcrm(1) 命 令 帅 除 消息 队列 ， 或 由 正在 再 启动 的 系统 删除 消 
息 队 列 。 将 此 与 管道 相 比 ， 当 最 后 一 个 访问 管道 的 进程 终止 时 ， 管 道 就 被 完全 地 删除 了 。 对 于 
FIFO 而 言 ， 虽 然 当 最 后 一 个 引用 FIFO 的 进程 终止 时 其 名 字 仍 保留 在 系统 中 ， 直 至 显 式 地 删除 
它 ,， 但 是 留 在 FIFO 中 的 数据 却 在 此 时 全 部 被 删除 ， 于 是 也 就 徒 有 其 名 了 。 

XSI IPC 的 另 一 个 问题 是 : 这 些 IPC 结 构 在 文件 系统 中 没有 名 字 。 我 们 不 能 用 第 3、 第 4 章 中 
所 述 的 函数 来 访问 它们 或 修改 它们 的 特性 。 为 了 支持 它们 不 得 不 增加 了 十 几 条 全 新 的 系统 调用 
(msgget、semop、shmat 等 )。 我 们 不 能 用 ls 命令 见 到 IPC 对 象 ， 不 能 用 rm 命令 删除 它们 ， 
也 不 能 用 chmod 命 令 更 改 它 们 的 访问 权限 。 于 是 ， 就 不 得 不 增加 新 的 命令 ipcs(1) 和 
iperm(1), 

因为 这 些 IPC 不 使 用 文件 描述 符 ， 所 以 不 能 对 它们 使 用 多 路 转 接 LVO 函 数 : select #Mpoll, 
这 就 使 得 难于 一 次 使 用 多 个 IPC 结 构 ， 以 及 在 文件 或 设备 VO 中 使 用 IPC 结 构 。 例 如 ， 没有 某 种 
形式 的 忙 一 等 待 循环 ， 就 不 能 使 一 个 服务 器 进程 等 待 将 要 放 在 两 个 消息 队列 任 一 个 中 的 消息 。 


bbs.theithome.com 


CA 








418 FASE 进程 间 通 信 


Andrade、Carges 和 Kovach[1989] 对 使 用 系统 V IPC 的 一 个 事务 处 理 系 统 进行 了 综述 。 他 们 
认为 系统 V IPC 使 用 的 名 字 空 间 (标识 符 ) 是 一 个 优点 而 不 是 前 面 所 说 的 问题 ， 理 由 是 使 用 标 
识 符 使 一 个 进程 只 要 使 用 单个 函数 调用 (msgsna) 就 能 将 一 个 消息 发 送 到 一 个 消息 队列 ， 而 
其 他 形式 的 IPC 则 通常 要 求 open、write 和 close。 这 种 论点 是 错误 的 。 为 了 避免 使 用 键 和 调 
用 msgget， 客户 进程 总 要 以 某 种 方式 获得 服务 器 进程 队列 的 标识 符 。 分 派 名 人 特定 队列 的 标识 
符 ， 取 决 于 在 创建 该 队列 时 有 多 少 消息 队列 已 经 存在 ， 也 取决 于 自 内 核 自 举 以 来 ， 内 核 中 将 分 
配给 新 队列 的 表 项 已 经 使 用 了 多 少 次 。 这 是 一 个 动态 值 ， 不 能 被 猜 出 或 事先 存放 在 一 个 头 文件 
中 。 正 如 15.6.1 节 所 述 ， 至 少 服务 器 进程 应 将 分 配给 队列 的 标识 符 写 到 一 个 文件 中 以 便 客户 进 
程 读 取 。 

这 些 作者 列举 的 消息 队列 的 其 他 优点 是 ，(a) 可 靠 ，(b) 流 是 受 控 的 ， (c) 面向 记录 ，(d) 可 
以 用 非 先 进 先 出 方式 处 理 。 正 如 在 14.4 节 中 所 见 ，STREAMS 也 具有 所 有 这 些 优 点 ， 两 者 之 间 
的 差别 是 ， 在 向 流 发 送 数 据 之 前 需要 一 个 open， 在 结束 时 需要 一 个 close。 表 15-3 对 这 些 不 同 

形式 IPC 的 某 些 特征 进行 了 比较 。 


表 15-3 不 同形 式 IPC 之 间 的 特征 比较 


Se 是 


| 消息 队列 | 
















Rz pm Mr Wc Rm 
D Bm ry pz oem 


STREAMS : 是 

UNIX 域 流 套 接 字 是 否 

UNIX 域 数据 报 套 接 字 否 否 
是 


FIFO ({ESTREAMS) f 





(第 16 章 将 对 UNIX 流 和 数据 报 套 接 字 进行 说 明 。 17.3 节 将 说 明 UNIX 域 套 接 字 。) 表 15-3 
中 的 “无 连接 ” 指 的 是 无 需 先 调用 某 种 形式 的 打开 函数 就 能 发 送 消 息 的 能 力 。 正如 前 述 ， 因 
为 需要 有 某 种 技术 以 获得 队列 标识 符 ， 所 以 我 们 并 不 认为 消息 队列 具有 无 连接 特性 。 因为 所 
有 这 些 形式 的 IPC 都 限制 用 在 单 主机 上 ， 所 以 它们 都 是 可 靠 的 。 当 消 息 通过 网 络 传送 时 ， 丢 
失 消息 的 可 能 性 就 要 加 以 考虑 。“ 沪 控制 ” 指 的 是 : 如 果 系 统 资源 (缓冲 区 ) 短缺 或 者 如 果 
接收 进程 不 能 再 接收 更 多 消息 ， 则 发 送 进程 就 要 休 眼 。 当 流 控制 条 件 消失 时 ， 发 送 进程 应 自 
动 地 被 唤醒 。 

表 15-3 中 没有 表示 的 一 个 特征 是 : IPC 设 施 能 否 自动 地 为 每 个 客户 进程 创建 一 个 到 服务 器 
进程 的 唯一 连接 。 第 17 章 将 说 明 ， STREAMS 以 及 UNIX 流 套 接 字 可 以 提供 这 种 能 力 。 

下 面 三 节 顺 次 对 三 种 形式 的 XSI IPC 进 行 详细 说 明 。 


15.7 消息 队列 


消息 队列 是 消息 的 链接 表 , 存 放 在 内 核 中 并 由 消息 队列 标识 符 标识 。 在 本 节 中 ， 我 们 把 消息 
队列 简称 为 队列 (queue), 其 标识 符 为 队列 ID (queue ID), 


Single UNIX Specification 在 其 实时 扩展 的 消息 传送 选项 中 包括 一 种 普 代 的 IPC 消 息 队 列 。 本 书 不 
讨论 实时 扩展 


msgget 用 于 创建 一 个 新 队列 或 打开 一 个 现存 的 队列 。msgsnd 将 新 消息 添加 到 队列 尾 端 . 
每 个 消息 包含 一 个 正 长 整 型 类 型 字段 ， 一 个 非 负 长 度 以 及 实际 数据 字 节 (HETKE), But 
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这 些 都 在 将 消息 添加 到 队列 时 ， 传 送 给 msgsnd。msgrcv 用 于 从 队列 中 取消 息 。 我 们 并 不 一 定 
要 以 先进 先 出 次 序 取消 息 ， 也 可 以 按 消息 的 类 型 字段 取消 息 。 
每 个 队列 都 有 一 个 msqid_ds 结 构 与 其 相关 联 : 


struct msgid ds { 


struct ipc perm msg perm; /* see Section 15.6.2 */ 
msggnum t msg qnum; /* 8 of messages on queue */ 
msglen t msg gbytes; /* max # of bytes on queue */ 
pid t msg lspid; /* pid of last msgsnd() */ 
pid t msg lrpid; /* pid of last msgrcv() */ 
time t msg stime; /* last-msgsnd() time */ 

time t msg rtime; /* last-msgrcv() time */ 

time t msg ctime; /* last-change time */ 


Is 
此 结构 规定 了 队列 的 当前 状态 。 结 构 中 所 示 的 各 成 员 是 由 Single UNIX Specification; ff), AL 
体 实 现 可 能 包括 标准 中 没有 定义 的 另 一 些 字段 。 

表 15-4 列 出 了 影响 消息 队列 的 系统 限制 。 表 中 “notsup” 表 示 相 关 平台 不 支持 该 特征 ， 
“derived” 表 示 这 种 限制 是 从 其 他 限制 导出 的 。 例 如 ， 在 Linux 系 统 中 ， 消 息 最 大 数 基于 队列 最 
大 数值 和 队列 中 允许 数据 量 的 最 大 值 。 如 果 最 短 消息 长 度 是 1 字 节 ， 则 系统 范围 内 的 消息 数 限 
制 是 最 大 消息 队列 数 x 队列 的 最 大 长 度 〈 字 节 )。 按 表 15-4 中 给 出 的 数据 ，Linux 软 认 配 置 的 最 
大 消息 数 (系统 范围 内 ) 是 262 144。( 即 使 一 个 消息 可 能 包含 0 字 节 数据 ，Linux 也 将 其 处 理 为 
如 同 包含 1 字 节 那样 ， 其 目的 是 限制 队列 中 的 消息 数 。) 


表 15-4 影响 消息 队列 的 系统 限制 


说 A FreeBSD | Linux Mac OS X 
5.2.1 2.4.22 10.3 



































可 发 送 最 长 消息 的 字 节 数 16 384 notsup 2 048 
一 个 特定 队列 的 最 大 字 节 数 ( 亦 即 队列 中 所 有 消息 之 和 ) 2 048 notsup 
系统 中 最 大 消息 队列 数 notsup 


4 
系统 中 最 大 消息 数 40 


notsup 


S5 &15-1, Mac OS X 10.3 不 支持 XSI 消 息 队 列 。 因 为 Mac OS XH ARF FreeBSD, 而 
FreeBSD 支 持 消息 队列 ， 所 以 使 Mac OS X 支 持 消息 队列 是 有 可 能 的 。 确 实 ， 一 个 良好 的 因特网 搜索 引 
学 将 提供 指针 ， 指 向 Max OS X 的 XSI 消 息 队列 的 第 三 方 蒿 口 。 


调用 的 第 一 个 函数 通常 是 nsgget ， 其 功能 是 打开 一 个 现存 队列 或 创建 一 个 新 队列 。 


#include <sys/msg.h> 


int msgget(key t key, int flag); 


返回 值 : 若 成 功 则 返回 消息 队列 ID， 若 出 错 则 返回 一 1 





15.6.1 布 说 明了 将 key 变 换 成 一 个 标识 符 的 规则 ， 并 且 讨 论 是 否 创建 一 个 新 队列 或 访问 一 个 现存 
队列 。 当 创建 一 个 新 队列 时 ， 初 始 化 msqid_ds 结 构 的 下 列 成 员 : 
“ipc_perm 结 构 按 15.6.2 节 中 所 述 进行 初始 化 。 该 结构 中 mode 成 员 按 fiag 中 的 相应 权限 位 
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设置 。 这 些 权限 用 表 15-2 中 的 常量 指定 。 
*msg qnum, msg_lspid、msg_lrpid、msg_stime 和 msg_rtime 都 设置 为 0。 
。msg_ctime 设 置 为 当前 时 间 。 
。msg_qbytes 设 置 为 系统 限制 值 。 
车 执行 成 功 ，msgget 运 回 非 负 队 列 iD。 此 后 ， 该 值 就 可 被 用 于 其 他 三 个 消息 队列 函数 。 
msgct1 国 数 对 队列 执行 多 种 操作 。 它 和 另外 两 个 与 信号 量 和 共享 存储 有 关 的 函数 
(semctlfüshmctl) 是 XSI IPC 的 类 似 于 ioct1 的 函数 ( 亦 即 垃圾 桶 函数 )。 


#include <sys/msg.h> 


int msgctl(int msgid, int cmd, struct msgid ds *buf); 


返回 值 : 若 成 功 则 返回 0、 若 出 错 则 返回 -1 


cmd 参 数 说 明 对 由 msqid 指 定 的 队列 要 执行 的 命令 : 

IPC STAT 取 此 队列 的 msqid_ds 结 构 ， 并 将 它 存放 在 buf 指 向 的 结构 中 。 

IPC SET 按 由 buf 指 向 结构 中 的 值 ， 设 置 与 此 队列 相关 结构 中 的 下 列 四 个 字段 : 
msg perm.uid, msg perm.gid, msg_perm.modefflmsg_gbytes, 此 
命令 只 能 由 下 列 两 种 进程 执行 : 一 种 是 其 有 效用 户 ID 等 于 msg_perm.cuia 
或 msg_perm.uid， 另 一 种 是 具有 超级 用 户 特权 的 进程 。 只 有 超级 用 户 才 能 
增加 msg_qbytes 的 值 。 

IPC RMID 从 系统 中 删除 该 消息 队列 以 及 仍 在 该 队列 中 的 所 有 数据 。 这 种 删除 立即 生效 。 
仍 在 使 用 这 一 消息 队列 的 其 他 进程 在 它们 下 一 次 试图 对 此 队列 进行 操作 时 ， 将 
出 错 返回 EIDRM。 此 命令 只 能 由 下 列 两 种 进程 执行 : 一 种 是 其 有 效用 户 ID 等 于 
msg perm.cuidakmsg perm.uid, 另 一 种 是 具有 超级 用 户 特权 的 进程 。 

这 三 条 命令 (IPC STAT, IPC SETÉIIPC RMID) 也 可 用 于 信号 量 和 共享 存储 。 
调用 msgsnd 将 数据 放 到 消息 队列 中 。 


#include <sys/msg.h> 





int msgsnd(int msgid, const void *ptr, size t nbytes, int flag); 


返回 值 : 若 成 功 则 返回 0、 若 出 错 则 返回 -1 


正如 前 面 提 及 的 ， 每 个 消息 都 由 三 部 分 组 成 ， 它 们 是 : 正 长 整 型 类 型 字段 、 非 负 长 度 (nbytes) 
以 及 实际 数据 字 节 (对 应 于 长 度 )。 消 息 总 是 放 在 队列 尾 端 。 
Ptr 参 数 指向 一 个 长 整 型 数 ， 它 包含 了 正 的 整 型 消息 类 型 ， 在 其 后 紧 跟 着 消息 数据 。( 若 
nbytes 是 0， 则 无 消息 数据 。) 若 发 送 的 最 长 消息 是 512 字 节 ， 则 可 定义 下 列 结构 : 
struct mymesg { 
long mtype; /* positive message type */ 
char mtext[512]; /* message data, of length nbytes */ 
}; 
于 是 ，ptr 就 是 一 个 指向 mymesg 结 构 的 指针 。 接 收 者 可 以 使 用 消息 类 型 以 非 先进 先 出 的 次 序 取 
消息 。 


菜 些 平台 既 支 持 32 位 环境 ， 又 支持 64 位 环境 。 这 影响 到 长 整 型 和 指针 的 大 小 。 例 如 ， 在 64 位 
SPARC 系 统 中 ，Solaris 友 许 32 位 和 64 位 应 用 同时 存在 。 如 果 一 个 32 位 应 用 经 由 管道 或 套 接 字 要 与 64 位 
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应 用 交换 此 结构 ,那么 ， 因 为 在 32 位 应 用 中 ， 长 整 型 的 大 小 是 4 字 节 ， 而 在 64 位 应 用 中 ， 长 整 型 的 大 小 
是 8 字 节 ， 这 就 造成 了 问题 。 这 意味 着 ，32 位 应 用 期 望 mtext 字 段 在 结构 起 始 地 址 后 的 第 4 个 字 节 处 开 
始 ， 而 仆 位 应 用 则 期 望 ntext 字 段 在 结构 起 始 地 址 后 的 第 8 个 字 节 处 开始 。 在 这 种 情况 下 ，64 位 应 用 的 
mtype 字 段 的 一 部 分 会 被 32 位 应 用 视 为 mtext 字 段 的 组 成 部 分 ,而 32 位 应 用 的 mtext 字 段 的 头 4 个 字 节 
会 被 64 位 应 用 解释 为 mtype 字 段 的 组 成 部 分 。 


但 是 ， 对 XSI 消 息 队 列 而 言 ， 这 种 问题 是 不 会 出 现 的 。Solaris 实 现 IPC 系统 调用 的 32 位 版 本 和 64 位 
版 本 ， 但 两 者 的 入 口 点 不 同 。 这 些 系 统 调 用 知道 如 何 处 理 32 位 应 用 与 64 位 应 用 的 通信 操作 ， 并 对 类 型 
字段 作 特 殊 处 理 以 避免 它 干 扰 消 息 的 数据 部 分 。 唯 一 可 能 出 问题 的 是 ， 当 64 位 应 用 向 32 位 应 用 发 送 一 
消息 时 ， 如 果 它 在 8 字 节 类 型 字段 中 设置 的 值 大 于 32 位 应 用 中 4 字 节 类 型 字段 可 表示 的 值 ， 那 么 32 位 应 
用 在 其 mtype 字 段 中 得 到 的 是 一 个 截 短 了 的 值 ， 于 是 也 就 去 失 了 信息 。 


参数 fiag 的 值 可 以 指定 为 TPC_NOWAIT。 这 类 似 于 文件 VO 的 非 阻塞 1/O 标 志 (9.14.25). 
车 消息 队列 已 满 (或 者 是 队列 中 的 消息 总 数 等 于 系统 限制 值 ， 或 队列 中 的 字 节 总 数 等 于 系统 限 
制 值 )， 则 指定 IPC_NOWAIT 使 得 msgsnd 立 即 出 错 返 回 EAGAIN。 如 果 没 有 指定 IPC_NOWAIT， 
则 进程 阻塞 直到 下 述 情况 出 现 为 止 有 空间 可 以 容纳 要 发 送 的 消息 ， 从 系统 中 删除 了 此 队列 ， 
或 捕捉 到 一 个 信号 , 并 从 信号 处 理 程序 返回 。 在 第 二 种 情况 下 , 返回 EIDRM (“标识 符 被 删除 ”)。 
最 后 一 种 情况 则 返回 EINTR。 

注意 ， 对 删除 消息 队列 的 处 理 不 是 很 完善 。 因 为 对 每 个 消息 队列 并 没有 设置 一 个 引用 计数 
器 (对 打开 文件 则 有 这 种 计数 器 )， 所 以 删除 一 个 队列 会 造成 仍 在 使 用 这 一 队列 的 进程 在 下 次 
对 队列 进行 操作 时 出 错 返 回 。 信 号 量 机 制 也 以 同样 方式 处 理 其 删除 。 相 反 ， 删 除 一 个 文件 时 ， 
要 等 到 使 用 该 文件 的 最 后 一 个 进程 关闭 了 它 的 文件 描述 符 后 ， 才 能 删除 文件 中 的 内 容 。 

当 msgsnd 成 功 返回 ， 与 消息 队列 相关 的 msaia_qas 结 构 得 到 更 新 ， 以 标明 发 出 该 调用 的 
进程 ID (msg_1spid)、 进 行 该 调用 的 时 间 (msg_stime)， 并 指示 队列 中 增加 了 一 条 消息 
(msg-qnum), 


msgrcv 从 队列 中 取 用 消息 : 


#include <sys/msg.h> 


ssize t msgrcv(int msgid, void *ptr, size t nbytes, long type, int flag); 


返回 值 ， 若 成 功 则 返回 消息 的 数据 部 分 的 长 度 ， 若 出 错 则 返回 一 1 


如 同 msgsnd 中 一 样 ，pir 参 数 指向 一 个 长 整 型 数 (返回 的 消息 类 型 存放 在 其 中 )， 跟 随 其 后 的 是 
存放 实际 消息 数据 的 缓冲 区 。nbytes 说 明 数 据 缓冲 区 的 长 度 。 若 返回 的 消息 大 于 nbytes， MEE 
flag 中 设置 了 MSG_NOERROR， 则 该 消息 被 截 短 。( 在 这 种 情况 下 ， 不 通知 我 们 消息 截 短 了 ， 消 
息 的 截 去 部 分 被 丢弃 。) 如 果 没 有 设置 这 一 标志 ， 而 消息 又 太 长 ， 则 出 错 返 回 E2BIG (消息 仍 
留 在 队列 中 )。 

参数 type 使 我 们 可 以 指定 想 要 哪 一 种 消息 : 

type == 0 返回 队列 中 的 第 一 个 消息 。 

type» 0 ”返回 队列 中 消息 类 型 为 ppe 的 第 一 个 消息 。 

type < 0 ”返回 队列 中 消息 类 型 值 小 二 或 等 于 type 绝 对 值 的 消息 ， 如 果 这 种 消息 有 若干 个 ， 

则 取 类 型 值 最 小 的 消息 。 
ipe 值 非 0 用 于 以 非 先进 先 出 次 序 读 消息 。 例 如 ， 若 应 用 程序 对 消息 赋 优 先 权 ， 那 么 ppe 就 
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可 以 是 优先 权 值 。 如 果 一 个 消息 队列 由 多 个 客户 进程 和 一 个 服务 器 进程 使 用 ， 那 么 type 字 段 可 
以 用 来 包含 客户 进程 的 进程 ID (只 要 进程 ID 可 以 存放 在 长 整 型 中 )。 

可 以 指定 jag 值 为 ITPC_NOWRAIT， 使 操作 不 阻塞 。 这 使 得 如 果 没 有 所 指定 类 型 的 消息 ， 则 
msgrcv 返 回 -1，errno 设 置 为 ENOMSG。 如 果 没 有 指定 IFC_NOWRIT， 则 进程 阻塞 直至 如 下 
情况 出 现 才 终止 : 有 了 指定 类 型 的 消息 ， 从 系统 中 删除 了 此 队列 (出错 则 返回 -1 且 errno 置 为 
EIDRM) ， 或 捕捉 到 一 个 信号 并 从 信号 处 理 程 序 返 回 (msgrcvikEl-1, errno E X 
EINTR), 

msgrcv 成 功 执 行 时 ， 内 核 更 新 与 该 消息 队列 相关 联 的 msqid_as 结 构 ， 以 指示 调用 者 的 
进程 ID (msg lrpid) 和 调用 时 间 (msg_rtime)， 并 将 队列 中 的 消息 数 (msg gnum) ml, 


‘Rol. 消息 队列 与 流 管道 的 耗 时 比较 


如 若 需要 客户 进程 和 服务 器 进程 之 间 的 双向 数据 流 ， 可 以 使 用 消息 队列 或 全 双 工 管道 。 
(回忆 表 15-1， 通 过 UNIX 域 套 接 字 机 制 (17.3 节 ) ， 全 双 工 管道 是 可 用 的 ， 而 某 些 平台 通过 
pipeH REAM T SÉ.) 

表 15-5 显 示 了 在 Solaris 上 三 种 技术 在 时 间 方 面 的 比较 ， 这 三 种 技术 是 : 消息 队列 、 基 于 
STREAMS 的 管道 和 UNIX 域 套 接 字 。 测 试 程序 先 创 建 IPC 通 道 ， 调 用 fork， 然 后 从 父 进程 向 子 
进程 发 送 约 200MB 数 据 。 数 据 发 送 的 方式 是 : 对 于 消息 队列 ， 调 用 100 000 次 msgsnd， 每 个 消 
息 长 度 为 2 000 字 节 ， 对 于 基于 STREAMS 的 管道 ， 调 用 100 000 次 write， 每 次 写 2 000 字 节 。 
时 间 都 以 秒 为 单位 。 


表 15-5 在 Solaris 上 三 种 IPC 的 时 间 比 较 


消息 队列 0.57 3.63 4.22 
STREAMS 管 道 0.50 3.21 3.71 
UNIX 域 套 接 字 







从 这 些 数字 中 可 见 ， 消 息 队 列 原来 的 实施 目的 是 提供 比 一 般 IPC 更 高 速度 的 进程 通信 方法 ， 
但 现在 与 其 他 形式 的 IPC 相 比 ， 在 速度 方面 已 经 没有 什么 差别 了 (事实 上 ， 基 于 STREAMS 的 管道 
快 于 消息 队列 )。( 在 原来 实施 消息 队列 时 ， 唯 一 的 其 他 形式 IPC 是 半 双 工 管道 .) 考虑 到 使 用 消息 
队列 具有 的 问题 ( 见 15.6.4 节 )， 我 们 得 出 的 结论 是 ， 在 新 的 应 用 程序 中 不 应 当 再 使 用 它们 。 D 


15.8 信号 量 
信号 量 (semaphore) 与 已 经 介绍 过 的 IPC 机 构 (管道 、FIFO 以 及 消息 列队 ) 不 同 。 它 是 一 
个 计数 器 ， 用 于 多 进程 对 共享 数据 对 象 的 访问 。 


Single UNIX Specification 在 其 实时 扩展 的 信号 量 选项 中 ， 包 括 了 信号 量 接口 的 替代 集 。 本 书 不 讨 
论 这 种 接口 。 
为 了 获得 共享 资源 ， 进 程 需要 执行 下 列 操作 ， 
(1) 测试 控制 该 资源 的 信号 量 。 
(2) 若 此 信和 号 量 的 值 为 正 ， 则 进程 可 以 使 用 该 资源 。 进 程 将 信号 量 值 减 1， 表 示 它 使 用 了 一 
个 资源 单位 。 
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(3) 若 此 信号 量 的 值 为 0， 则 进程 进入 休眠 状态 ， 直 至 信号 量 值 大 于 0。 进 程 被 唤醒 后 ， 它 
返回 至 第 (1) 步 。 

当 进程 不 再 使 用 由 一 个 信号 量 控制 的 共享 资源 时 ， 该 信号 量 值 增 1。 如 果 有 进程 正在 休眠 
等 待 此 信号 量 ， 则 唤醒 它们 。 

为 了 正确 地 实现 信号 量 ， 信 号 量 值 的 测试 及 减 1 操作 应 当 是 原子 操作 。 为 此 ， 信 号 量 通常 
是 在 内 核 中 实现 的 。 

常用 的 信号 量 形式 被 称 为 二 元 信号 量 或 双 态 信号 量 (binary semaphore) 。 它 控制 单个 资源 ， 
初始 值 为 1。 但 是 一 般 而 言 ， 信 号 量 的 初 值 可 以 是 任 一 正 值 ， 该 值 说 明 有 多 少 个 共享 资源 单位 
可 供 共享 应 用 。 

遗憾 的 是 ，XSI 的 信号 量 与 此 相 比 要 复杂 得 多 。 三 种 特性 造成 了 这 种 并 非 必要 的 复杂 性 : 

(1) 信号 量 并 非 是 单个 非 负 值 ， 而 必需 将 信号 量 定义 为 含有 一 个 或 多 个 信号 量 值 的 集合 。 
当 创建 一 个 信号 量 时 ， 要 指定 该 集合 中 信号 量 值 的 数量 。 

(2) 创建 信号 量 (senget) 与 对 其 赋 初 值 (semctl) 分 开 。 这 是 一 个 致命 的 弱点 ， 因 为 
不 能 原子 地 创建 一 个 信号 量 集合 ， 并 且 对 该 集合 中 的 各 个 信号 量 值 贼 初 值 。 

(3) 即使 没有 进程 正在 使 用 各 种 形式 的 XSI IPC， 它 们 仍然 是 存在 的 。 有 些 程序 在 终止 时 并 
没有 释放 已 经 分 配给 它 的 信号 量 ， 所 以 我 们 不 得 不 为 这 种 程序 担心 。 下 面 将 要 说 明 的 undo 功 
能 就 是 假定 要 处 理 这 种 情况 的 。 

内 核 为 每 个 信号 量 集合 设置 了 一 个 semid_ds 结 构 ， 

struct semid ds { 

struct ipc perm sem perm; /* gee Section 15.6.2 */ 
unsigned short sem_nsems; /* # of semaphores in set */ 


time_t sem_otime; /* last-semop() time */ 
time_t sem_ctime; /* last-change time */ 


E 
Single UNIX Specification 定 义 了 上 面 所 示 的 各 字段 ， 但 是 具体 实现 可 在 semid_ds 结 构 中 定义 


添加 的 成 员 。 
每 个 信和 号 量 由 一 个 无 名 结构 表示 ， 它 至 少 包含 下 列 成 员 : 


struct ( 
unsigned short  semval; /* semaphore value, always >= 0 */ 
pid t sempid; /* pid for last operation */ 


unsigned short  semncnt; /* # processes awaiting semval»curval */ 
unsigned short  semzcnt; /* # processes awaiting semval==0 */ 


be 
表 15-6 列 出 了 影响 信号 量 集合 的 系统 限制 〈( 见 15.6.3 节 ) 。 
要 获得 一 个 信号 量 ID ， 要 调用 的 第 一 个 函数 是 semget。 


#include <sys/sem.h> 


int semget (key t key, int nsems, int flag); 


返回 值 : 车 成 功 则 返回 信号 量 ID ， 若 出 错 则 返回 -1 
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表 15-6 影响 信号 量 的 系统 限制 
典型 值 


任 一 信号 量 的 最 大 值 
任 一 信号 量 的 最 大 的 终止 时 调整 值 
系统 中 信号 量 集 的 最 大 数 


系统 中 信号 量 的 最 大 数 

每 个 信号 量 集中 的 最 大 信号 量 数 
系统 中 undo 结 构 的 最 大 数 

每 个 undo 结 构 中 的 最 大 undo 项 数 
每 个 semop 调 用 中 的 最 大 操作 项 数 





15.6.1 节 说 明了 将 key 变 换 为 标识 符 的 规则 ， 讨 论 了 是 否 创建 一 个 新 集合 ， 或 是 引用 一 个 现 
存 的 集合 。 创 建 一 个 新 集合 时 ， 对 semid_ds 结 构 的 下 列 成 员 赋 初 值 

“ 按 15.6.2 节 中 所 述 ， 对 ipc_perm 结 构 赋 初 值 。 该 结构 中 的 moae 被 设置 为 Pag 中 的 相应 权 

限 位 。 这 些 权 限 是 用 表 15-2 中 的 常量 设置 的 。 

。sem_otime 设 置 为 0。 

。sem_ctime 设 置 为 当前 时 间 。 

。sem_nsems 设 置 为 nsems。 

nsems 是 该 集合 中 的 信号 量 数 。 如 果 是 创建 新 集合 (一般 在 服务 器 进程 中 )， 则 必须 指定 
nsems。 如 果 引 用 一 个 现存 的 集合 (一 个 客户 进程 )， 则 将 nsems 指 定 为 0。 

semct1 消 数 包 含 了 多 种 信号 量 操作 。 


#include <sys/sem.h> 


int semctl (int semid, int semnum, int cmd, 


. /* union semun arg */); 


返回 值 ，( 见 下 ) 





注意 ， 依 赖 于 所 请 求 的 命令 ， 第 四 个 参数 是 可 选 的 ， 如 果 使 用 该 参数 ， 则 其 类 型 是 semun， 它 
是 多 个 特定 命令 参数 的 联合 (union); 
es iic val; /* for SETVAL */ 


struct semid ds  *buf; /* for IPC STAT and IPC SET */ 
unsigned short *array; /* for GETALL and SETALL */ 


注意 ， 这 是 一 个 联合 ， 而 非 指向 联合 的 指针 。 
cmd 参 数 指定 下 列 10 种 命令 中 的 一 种 ， 在 semid 指 定 的 信号 量 集合 上 执行 此 命令 。 其 中 有 5 
条 命令 是 针对 一 个 特定 的 信号 量 值 的 ， 它 们 用 semnum 指 定 该 信号 量 集合 中 的 一 个 成 员 。 
semnum 值 在 0 和 nsems 一 1 之 间 (包括 0 和 nsems 一 1 ) 。 
IPC STAT 对 此 集合 取 semid_ds 结 构 ， 并 存放 在 由 arg.bu/ 指 向 的 结构 中 。 
IPC SET 按 由 arg.buf 指 向 结构 中 的 值 设置 与 此 集合 相关 结构 中 的 下 列 三 个 字 v 段 值 ， 
sem_perm.uid、sem_perm.gid 和 sem_perm.mode。 此 命令 只 能 由 下 列 
两 种 进程 执行 :一 种 是 其 有 效用 户 ID 等 于 sem_perm.cuid 或 
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sem_perm.uid 的 进程 ; 另 一 种 是 具有 超级 用 户 特权 的 进程 。 

IPC_RMID 从 系统 中 删除 该 信号 量 集合 。 这 种 删除 是 立即 发 生 的 。 仍 在 使 用 此 信号 量 集 
合 的 其 他 进程 在 它们 下 次 试图 对 此 信号 量 集合 进行 操作 时 ， 将 出 错 返回 
EIDRM。 此 命令 只 能 由 下 列 两 种 进程 执行 : 一 种 是 其 有 效用 户 ID 等 于 
sem_perm.cuid 或 sem_perm.uid 的 进程 ， 另 一 种 是 具有 超级 用 户 特权 的 
进程 。 

GETVAL 返回 成 员 semnum 的 semval 值 。 

SETVAL 设置 成 员 semnum 的 semval 值 。 该 值 由 arg.val 指 定 。 

GETPID 返回 成 员 semnum 的 sempid 值 。 

GETNCNT ”返回 成 册 semnum 的 semncnt 值 。 

GETZCNT ”返回 成 册 semnum 的 semzcnt 值 。 

GETALL 取 该 集合 中 所 有 信号 量 的 值 ， 并 将 它们 存放 在 由 arg.array 指 向 的 数组 中 。 

SETALL 按 arg.array 指 向 的 数组 中 的 值 ， 设 置 该 集合 中 所 有 信和 号 量 的 值 。 

对 于 除 GETALLLA 外 的 所 有 GET 命 令 ，semct1 函 数 都 返回 相应 的 值 。 其 他 命令 的 返回 值 为 0。 

尔 数 semop 自 动 执行 信号 量 集合 上 的 操作 数组 ， 这 是 个 原子 操作 。 


#include <sys/sem.h> 


int semop(int semid, struct sembuf semoparray{], size t nops); 


BE: 若 成 功 则 返回 9， 若 出 错 则 返回 -1 





参数 semoparray 是 一 个 指针 ， 它 指向 一 个 信号 量 操作 数组 ， 信 号 量 操作 由 sembuf 结 构 表示 : 


struct sembuf { 


unsigned short sem num; /* member # in set (0, 1, ..., nsems-1) */ 
short sem op; /* operation (negative, 0, or positive) */ 
Short sem flg; /* IPC NOWAIT, SEM UNDO */ 


}; 
参数 nops 规 定 该 数组 中 操作 的 数量 (元 素数 )。 

对 集合 中 每 个 成 员 的 操作 由 相应 的 sem_op 值 规定 。 此 值 可 以 是 负 值 、0 或 正 值 。( 下 面 的 
讨论 将 提 到 信号 量 的 undo 标 志 。 此 标志 对 应 于 相应 sem_f1g 成 员 的 SEM_UNDO 位 。) 

(1) 最 易于 处 理 的 情况 是 sem_op 为 正 。 这 对 应 于 进程 释放 占用 的 资源 数 。sem_op 值 加 到 
信号 量 的 值 上 。 如 果 指 定 了 undo 标 志 ， 则 也 从 该 进程 的 此 信号 量 调整 值 中 减 去 sem_op。 

(2) 车 sem_op 为 负 ， 则 表示 要 获取 由 该 信号 量 控制 的 资源 。 

如 车 该 信号 量 的 值 大 于 或 等 于 sem_op 的 绝对 值 (具有 所 需 的 资源 )， 则 从 信号 量 值 中 减 去 
sem_op 的 绝对 值 。 这 保证 信号 量 的 结果 值 大 于 或 等 于 0。 如 果 指 定 了 undo 标 志 ， 则 sem_op 的 
绝对 值 也 加 到 该 进程 的 此 信号 量 调整 值 上 。 

如 果 信 号 量 值 小 于 sem_op 的 绝对 值 (资源 不 能 满足 要 求 )， 则 : 

(a) 若 指 定 了 IPC_NOWAIT， 则 semop 出 错 返 回 EAGAIN。 

(b) 车 未 指定 IPC_NOWAIT, 则 该 信号 量 的 semncnt 值 加 1 (因为 调用 进程 将 进入 休眠 状态 )， 
然后 调用 进程 被 桂 起 直至 下 列 事件 之 一 发 生 : 

G) 此 信号 量变 成 大 于 或 等 于 sem_op 的 绝对 值 〈 即 某 个 进程 已 释放 了 某 些 资源 ) 。 此 信 
号 量 的 semncnt 值 减 1 (因为 已 结束 等 待 ) ,并 且 从 信号 量 值 中 减 去 sem_op 的 绝对 值 。 
如 果 指 定 了 undo 标 志 , 则 sem_op 的 绝对 值 也 加 到 该 进程 的 此 信和 号 量 调整 值 上 。 
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Gi) 从 系统 中 删除 了 此 信和 号 量 。 在 此 情况 下 ， 函 数 出 错 则 返回 EIDRM。 
Gii) 进程 捕捉 到 一 个 信号， 并 从 信号 处 理 程序 返回 。 在 此 情况 下 ， 此 信和 号 量 的 
semncnt 值 减 1 (因为 调用 进程 不 再 等 待 )， 并 且 函 数 出 错 返 回 EINTR。 
(3) 车 sem_op 为 0， 这 表示 调用 进程 希望 等 待 到 该 信号 量 值 变 成 0。 
如 果 信 和 号 量 值 当 前 是 0， 则 此 函数 立即 返回 。 
dus AIEO, Wl. 
(a) 若 指定 了 IPC_NOWRAIT， 则 出 错 返 回 EAGAIN。 
(b) 若 未 指定 IPC_NOWRAIT, 则 该 信号 量 的 semzcnt 值 加 1( 因 为 调用 进程 将 进入 休眠 状态 )， 
然后 调用 进程 被 挂 起 ， 直 至 下 列 事件 之 一 发 生 为 止 ; 
(i) 此 信号 量 值 变 成 0。 此 信号 量 的 semzcnt 值 减 1 (因为 调用 进程 已 结束 等 待 ) 。 
(ii) 从 系统 中 删除 了 此 信号 量 。 在 此 情况 下 ， 函 数 出 错 返 回 EIDRM。 
(ii) 进程 捕捉 到 一 个 信号， 并 从 信号 处 理 程序 返回 。 在 此 情况 下 此 信号 量 的 semzcnt 
ERI (因为 调用 进程 不 再 等 待 )， 并 且 函 数 出 错 返 回 EINTR。 
semop 函 数 具有 原子 性 ， 它 或 者 执行 数组 中 的 所 有 操作 ， 或 者 什么 也 不 做 。 
exit 时 的 信号 量 调整 
正如 前 面 提 到 的 ， 如 果 在 进程 终止 时 ， 它 占用 了 经 由 信号 量 分 配 的 资源 ， 那 么 就 会 成 为 一 
个 问题 。 无 论 何 时 ， 只 要 为 信号 量 操作 指定 了 SEM_UNDo 标 志 ， 然 后 分 配 资源 (sem_op 值 小 
于 0) ， 那 么 内 核 就 会 记 住 对 于 该 特定 信号 量 ， 分 配给 调用 进程 多 少 资源 (sem_op 的 绝对 值 ) 。 
当 该 进程 终止 时 ， 不 论 自愿 或 者 不 自愿 ， 内 核 都 将 检验 该 进程 是 否 还 有 尚未 处 理 的 信和 号 量 调整 
值 ， 如 果 有 ， 则 按 调整 值 对 相应 量 值 进行 处 理 。 
如 果 用 带 SETVRAL 或 SETRLL 命 令 的 semct1 设 置 一 信号 量 的 值 ， 则 在 所 有 进程 中 ， 对 于 该 
信和 号 量 的 调整 值 都 设置 为 0。 


Rol. 信号 量 与 记录 锁 的 耗 时 比较 


如 果 多 个 进程 共享 一 个 资源 ， 则 可 使 用 信号 量 或 记录 锁 。 对 这 两 种 技术 在 时 间 上 的 差别 进 
行 比较 是 有 益 的 。 

车 使 用 信号 量 ， 则 先 创建 一 个 包含 一 个 成 员 的 信号 量 集合 ， 然 后 对 该 信号 量 值 赋 初 值 1。 
为 了 分 配 资源 ， 以 sem_op 为 -1 调用 semop， 为 了 释放 资源 ， 则 以 sem_op 为 +1 调 用 semop。 
对 每 个 操作 都 指定 SEM_UNDO， 以 处 理 在 未 释放 资源 条 件 下 进程 终止 的 情况 。 

车 使 用 记录 锁 ， 则 先 创 建 一 个 空 文件 ， 并 且 用 该 文件 的 第 一 个 字 节 (无 需 存在 ) 作为 锁 字 
节 。 为 了 分 配 资 源 ， 先 对 该 字 节 获得 一 个 写 锁 ， 释 放 该 资源 时 ， 则 对 该 字 节 解锁 。 记 录 锁 的 性 
质 确保 了 当 一 个 锁 的 属 主 进程 终止 时 ， 内 核 会 自动 释放 该 锁 。 

表 15-7 显 示 了 在 Linux 上 使 用 这 两 种 不 同 技术 进行 锁 操作 所 需 的 时 间 。 在 每 一 种 情况 中 ， 资 
源 都 被 分 配 ， 然 后 释放 ， 如 此 循环 10 000 次 。 这 同时 由 三 个 不 同 的 进程 执行 。 表 15-7 中 所 示 的 
时 间 是 三 个 进程 的 总 计 ， 单 位 是 秒 。 


表 15-7 信号 量 锁 和 记录 锁 的 时 间 比 较 


带 undo 的 信号 量 
建议 性 记录 锁 
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在 Linux 上 ， 记 录 锁 与 信号 量 锁 相 比 ， 在 时 间 上 要 多 耗 用 约 609% 。 

虽然 记录 锁 慢 于 信号 量 锁 ， 但 如 果 只 需 锁 一 个 资源 〈 例 如 共 享 存储 段 ) 并 且 不 需要 使 用 
XSI 信 号 量 的 所 有 花哨 的 功能 ， 则 宁可 使 用 记录 锁 。 理 由 是 使 用 简易 ， 且 进程 终止 时 系统 会 处 
理 任 何 遗 留 下 来 的 锁 。 口 


15.9 共享 存储 


共享 存储 允许 两 个 或 更 多 进程 共享 一 给 定 的 存储 区 。 因 为 数据 不 需要 在 客户 进程 和 服务 器 
进程 之 闻 复 制 ， 所 以 这 是 最 快 的 一 种 IPC。 使 用 共享 存储 时 要 掌握 的 唯一 窍门 是 多 个 进程 之 间 
对 一 给 定 存 储 区 的 同步 访问 。 若 服务 器 进程 正在 将 数据 放 入 共享 存储 区 ， 则 在 它 做 完 这 一 操作 
之 前 ， 客 户 进程 不 应 当 去 取 这 些 数 据 。 通 常 ， 信 号 量 被 用 来 实现 对 共享 存储 访问 的 同步 。( 不 
过 正如 前 节 最 后 部 分 所 述 ， 记 录 锁 也 可 用 于 这 种 场合 。) 


Single UNIX Speciication 在 其 实时 扩展 的 共享 存储 对 象 选 项 中 ， 包 括 了 访问 共享 存储 的 一 秦 替 代 
接口 。 在 本 书 中 不 涉及 该 实时 扩展 。 


内 核 为 每 个 共享 存储 段 设 置 了 一 个 shmia_aqs 结 构 。 


struct shmid ds { 
struct ipc perm shm perm; /* see Section 15.6.2 */ 


size t shm segsz; /* size of segment in bytes */ 
pid t shm lpid; /* pid of last shmop() */ 

pid t shm cpid; /* pid of creator */ 

shmatt t shm nattch;  /* number of current attaches */ 
time t shm atime; /* last-attach time */ 

time t shm dtime; /* last-detach time */ 

time t shm ctime; /* last-change time */ 


h 


(按照 支持 共享 存储 段 的 需要 ， 每 种 实现 会 在 shmia_das 结 构 中 增加 其 他 成 员 。) 
shmatt_t 类 型 定义 为 不 带 符号 整 型 ， 它 至 少 与 unsigned short 一 样 大 。 表 15-8 列 出 了 
影响 共享 存储 的 系统 限制 ( 见 15.6.3 节 )。 


表 15-8 ”影响 共享 存储 的 系统 限制 


典 型 值 


明 
FreeBSD 5.2.1 Linux 2.4.22 Mac OS X 10.3 | Solaris 9 | 


共享 存储 段 的 最 大 字 节 数 33 554 432 33 554 432 


共享 存储 段 的 最 小 字 节 数 1 1 
系统 中 共享 存储 段 的 最 大 段 数 192 4 096 
每 个 进程 共享 存储 段 的 最 大 段 数 128 4 096 


为 获得 一 个 共享 存储 标识 符 ， 调 用 的 第 一 个 函数 通常 是 shmget。 





#include <sys/shm.h> 


int shmget(key t key, size t size, int flag); 
返回 值 : 若 成 功 则 返回 共享 存储 ID ， 若 出 错 则 返回 -1 
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15.6.1 节 说 明了 将 key 变 换 成 一 个 标识 符 的 规则 ， 以 及 是 创建 一 个 新 共享 存储 段 还 是 引用 一 个 现 
存 的 共享 存储 段 。 当 创建 一 个 新 段 时 ， 初 始 化 shmid_ds 结 构 的 下 列 成 员 : 

。ipc_perm 结 构 按 15.6.2 节 中 所 述 进 行 初始 化 。 该 结构 中 的 mode 成 员 按 flag 中 的 相应 权限 

位 设置 。 这 些 权限 用 表 15-2 中 的 常量 指定 。 

“shm_lipid、shm_nattach、shm_atime、 以 及 shm_dtime 都 设置 为 0。 

。shm_ctime 设 置 为 当前 时 间 。 

“shm_segsz 设 置 为 请 求 的 长 度 (size)。 

参数 size 是 该 共享 存储 段 的 长 度 (单位 : 字 节 )。 实 现 通常 将 其 向 上 取 为 系统 页 长 的 整数 倍 。 
但 是 ， 车 应 用 指定 的 size 值 并 非 系统 页 长 的 整数 倍 ， 那 么 最 后 一 页 的 余下 部 分 是 不 可 使 用 的 。 
如 果 正 在 创建 一 个 新 段 (一 般 是 在 服务 器 进程 中 )， 则 必须 指定 其 size。 如 果 正 在 引用 一 个 现存 
的 段 (一 个 客户 进程 )， 则 将 size 指 定 为 0。 当 创建 一 新 段 时 ， 段 内 的 内 容 初 始 化 为 0。 

shmct1 函 数 对 共享 存储 段 执行 多 种 操作 。 


#include «sys/shm.h» 


int shmctl(int shmid, int cmd, struct shmid ds *buf); 


返回 值 : 车 成 功 则 返回 0， 车 出 错 则 返回 -1 





cmd 参 数 指定 下 列 5 种 命令 中 一 种 ， 使 其 在 shmid 指 定 的 段 上 执行 。 

IPC STAT 取 此 有 段 的 shmi6G_ds 结 构 ， 并 将 它 存放 在 由 bu 指向 的 结构 中 。 

IPC SET 按 buf 指 向 结构 中 的 值 设置 与 此 段 相关 结构 中 的 下 列 三 个 字段 ，shm_perm. 
uid、shm_perm.gid 以 及 shm_perm.mode。 此 命令 只 能 由 下 列 两 种 进程 
执行 ,一 种 是 其 有 效用 户 ID 等 于 shm_perm.cuid 或 shm_perm.uid 的 进 
程 ， 另 一 种 是 具有 超级 用 户 特权 的 进程 。 

IPC RMID 从 系统 中 删除 该 共享 存储 段 。 因 为 每 个 共享 存储 段 有 一 个 连接 计数 
(shmid_ds 结 构 中 的 shm_nattch 字 段 )， 所 以 除非 使 用 该 段 的 最 后 一 个 进程 
终止 或 与 该 段 脱节 ， 否 则 不 会 实际 上 删除 该 存储 段 。 不 管 此 段 是 否 仍 在 使 用 ， 
该 段 标识 符 立 即 被 删除 ,所 以 不 能 再 用 shmat 与 该 段 连接 。 此 命令 只 能 由 下 列 
两 种 进程 执行 :一 种 是 其 有 效用 户 ID 等 于 shm_perm.cuia 或 shm_perm.uia 
的 进程 ， 另 一 种 是 具有 超级 用 户 特权 的 进程 。 

Linux 和 Solaris 提 供 了 下 列 另 外 两 种 命令 ， 但 它们 并 非 Single UNIX Specification 的 组 成 部 分 : 

SHM LOCK 将 共享 存储 段 锁定 在 内 存 中 。 此 命令 只 能 由 超级 用 户 执行 。 

SHM UNLOCK 解锁 共享 存储 段 。 此 命令 只 能 由 超级 用 户 执行 。 

一 旦 创建 了 一 个 共享 存储 段 ， 进 程 就 可 调用 shmat 将 其 连接 到 它 的 地 址 空间 中 。 


#include <sys/shm.h> 


void *shmat (int shmid, const void *addr, int flag); 


返回 值 : 若 成 功 则 返回 指向 共享 存储 的 指针 ， 若 出 错 则 返回 -1 


共享 存储 段 连 接 到 调用 进程 的 哪个 地 址 上 与 addr 参 数 以 及 在 flag 中 是 否 指定 SHM_RND 位 有 关 。 
* 如果 addr 为 0， 则 此 段 连接 到 由 内 核 选择 的 第 一 个 可 用 地 址 上 。 这 是 推荐 的 使 用 方式 。 
。 如 果 addr 括 0， 并 且 没 有 指定 SHM_RND， 则 此 段 连接 到 addr 所 指定 的 地 址 上 。 
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。 如 果 addr 非 0， 并 且 指 定 了 SHM_RND， 则 此 段 连接 到 (addr—(addr mod ulus SHMLBA)) 所 

表示 的 地 址 上 。SHM_RND 命 令 的 意思 是 “ 取 整 "。SHMLBA 的 意思 是 “ 低 边 界 地 址 倍数 ”， 

它 总 是 2 的 乘 方 。 该 算式 是 将 地 址 向 下 取 最 近 1 个 SHMLBA 的 倍数 。 

除非 只 计划 在 一 种 硬件 上 运行 应 用 程序 (这 在 当今 是 不 大 可 能 的 ) ， 否 则 不 应 指定 共享 段 
所 连接 到 的 地 址 。 所 以 一 般 应 指定 addr 为 0， 以 便 由 内 核 选择 地 址 。 

如 果 在 filag 中 指定 了 SHM_RDONLY 位 ， 则 以 只 读 方式 连接 此 段 。 否 则 以 读 写 方式 连接 此 有 段 。 

shmat 的 返回 值 是 该 段 所 连接 的 实际 地 址 ， 如 果 出 错 则 返回 -1。 如 果 shmat 成 功 执行 ， 那 
么 内 核 将 使 该 共享 存储 段 shmiad_ds 结 构 中 的 shm_nattch 计 数 器 值 加 1。 

当 对 共享 存储 段 的 操作 已 经 结束 时 ， 则 调用 shmat 脱 接 该 段 。 注 意 ， 这 并 不 从 系统 中 删除 
其 标识 符 以 及 其 数据 结构 。 该 标识 符 仍然 存在 ， 直 至 某 个 进程 (一般 是 服务 器 进程 ) 调用 
shmctl (#44 IPC_RMID) 特地 删除 它 。 


#include <sys/shm.h> 


int shmdt (void *addr) ; 


BEA: 车 成 功 则 返回 0， 若 出 错 则 返回 一 ! 





addr 参 数 是 以 前 调用 shmat 时 的 返回 值 。 如 果 成 功 ，shmat 将 使 相关 shmid_ads 结 构 中 的 
shm_nattch 计 数 器 值 减 1。 





内 核 将 以 地 址 0 连接 的 共享 存储 段 放 在 什么 位 置 上 与 系统 密切 相关 。 程 序 清单 15-11 打 印 一 
些 信息 ， 它 们 与 特定 系统 将 各 种 不 同类 型 的 数据 放 在 什么 位 置 有 关 。 


程序 清单 15-11 打印 各 种 不 同类 型 的 数据 所 存放 的 位 置 


#include "apue .hn 
#include <sys/shm.h> 


#define ARRAY SIZE 40000 
#define MALLOC SIZE 100000 
#define SHM SIZE 100000 
#define SHM MODE 0600 /* user read/write */ 


char array[ARRAY SIZE];  /* uninitialized data - bss */ 


int 
main (void) 


int shmid; 
char *ptr, *shmptr; 
printf("array[] from $1x to $1xWMn", (unsigned long)&array[0], 
(unsigned long) &array [ARRAY SIZE]); 
printf("stack around %1x\n", (unsigned long) &shmid) ; 
if ((ptr = malloc(MALLOC_SIZE)) == NULL) 
err_sys("malloc error"); 
printf ("malloced from %1x to %1x\n", (unsigned long)ptr, 


(unsigned long)ptr«MALLOC SIZE); 


if ((shmid - shmget(IPC PRIVATE, SHM SIZE, SHM MODE)) « 0) 
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err_sys("shmget error"); 
if ((shmptr = shmat(shmid, 0, 0)) == (void *)-1) 
err_sys("shmat error") ; 
printf ("shared memory attached from $1x to %1x\n", 
(unsigned long)shmptr, (unsigned long) shmptr+SHM SIZE); 


if (shmctl(shmid, IPC RMID, 0) < 0) 
err SyS("shmctl error"); 


exit (0); 


) 
在 一 个 基于 Intel 的 Linux 系 统 上 运行 此 程序 ， 其 输出 如 下 : 


$ ./a.out 

array[] from 804a080 to 8053ccO 

Stack around bffff9e4 

malloced from 8053cc8 to 806c368 

Shared memory attached from 40162000 to 4017a6a0 


图 15-13 描 绘 了 这 种 情况 ， 这 与 图 7-3 中 所 示 的 典型 存储 区 布局 类 似 。 注 意 ， 共 享 存储 段 紧 靠 在 
EXT. 口 


) 命令 行 参 数 和 环境 变量 






Oxbffff9e4 


0x4017a6a0 


re 
ox40162000 共享 存储 ，100 000 字 节 


0x0806c368 
malloc 100 00055 
0x08053cc8 


0x08053ccO 





d 
ox0804a080 f array[] 40000375 


非 初始 化 数据 
初始 化 数据 


EN 


图 15-13 在 基于 Intel 的 Linux 系 统 上 的 存储 区 布局 


14.9 节 中 曾 说 明 mmap 函 数 可 将 一 个 文件 的 若干 部 分 映射 至 进程 地 址 空间 。 这 在 概念 上 类 似 
于 用 shmat XSI IPC 函 数 连接 一 共享 存储 段 。 两 者 之 间 的 主要 区 别 是 ， 用 mmap 映 射 的 存储 段 是 
与 文件 相关 联 的 ， 而 XSI 共 享 存储 段 则 并 无 这 种 关联 。 


共享 存储 可 由 不 相关 的 进程 使 用 。 但 如 果 进 程 是 相关 的 ， 则 某 些 实现 提供 了 一 种 不 同 的 技术 。 


下 面 说 明 的 技术 用 于 FreeBSD 5.2.1, Linux 2.4.22 和 Solaris 9, Mac OS X 10.3 当 前 并 不 支持 将 字符 
设备 映射 至 进程 地 址 空间 - 


低地 址 


在 读 设 备 /daev/zero 时 ， 该 设备 是 0 字 节 的 无 限 资源 。 它 也 接收 写 向 它 的 任何 数据 ， 但 又 
忽略 这 些 数据 。 我 们 对 此 设备 作为 IPC 的 兴趣 在 于 ， 当 对 其 进行 存储 映射 叶 ， 它 具有 一 些 特殊 
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的 性 质 ， 
。 创 建 一 个 未 名 存储 区 ， 其 长 度 是 mmap 的 第 二 个 参数 ， 将 其 向 上 取 整 为 系统 的 最 近 页 长 。 
“ 存储 区 都 初始 化 为 0。 
“ 如 果 多 个 进程 的 共同 祖先 进程 对 mmap 指 定 了 MAP_SHARED 标 志 ， 则 这 些 进程 可 共享 此 存 
储 区 。 i 
程序 清单 15-12 是 使 用 此 特殊 设备 的 一 个 例子 。 


程序 清单 15-12 在 父 、 子 进程 间 使 用 /dev/zero 存 储 映射 /O 的 iPC 


#include "apue.h" 
#include «fcntl.h» 
#include <sys/mman.h> 


#define NLOOPS 1000 
#define SIZE sizeof (long) /* size of shared memory area */ 


static int 
update (long *ptr) 


{ 
} 


int 
main (void) 


{ 


return ((*ptr) ++); /* return value before increment */ 


int fd, i, counter; 
pid t pid; 
void *area; 


if ((fd = open("/dev/zero", O RDWR)) < 0) 
err_sys ("open error"); 
if ((area = mmap(0, SIZE, PROT READ | PROT WRITE, MAP SHARED, 
fd, 0)) == MAP FAILED) 
err SyS("mmap error"); 
close (fd); /* can close /dev/zero now that it's mapped */ 


TELL WAIT(); 


if ((pid = fork()) « 0) { 
err_sys ("fork error"); 


) else if (pid > 0) { /* parent */ 
for (i = 0; i < NLOOPS; i += 2) { 
if ((counter = update((long *)area)) != i) 


err quit("parent: expected td, got td", i, counter); 
TELL_CHILD (pid) ; 
WAIT CHILD(); 


) eise ( /* child */ 
for (i = 1; i « NLOOPS + 1; i += 2) { 
WAIT _PARENT () ; 


if ((counter = update((long *)area)) != i) 
err quit("child: expected td, got $d", i, counter); 


TELL PARENT (getppid()); 


) 


exit (0); 
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它 打开 此 /aev/zero 设 备 ， 然 后 指定 长 整 型 的 长 度 调用 mmap。 注 意 ， 一 旦 存储 区 映射 成 
功 ， 就 关闭 此 设备 。 然 后 ， 进 程 创建 一 个 子 进程 。 因 为 在 调用 mmap 时 指定 了 MAP_SHARED， 
所 以 一 个 进程 写 到 存储 映射 区 的 数据 可 由 另 一 进程 见 到 。( 如 果 已 指定 MAP_PRIVATE， 则 此 示 
例 程序 不 能 工作 。) 

然后 ， 父 、 子 进程 交替 运行 ， 使 用 8.9 节 中 的 同步 函数 各 自 对 共享 存储 映射 区 中 的 长 整 型 数 
加 1。 存 储 映射 区 由 mmap 初 始 化 为 0。 父 进程 先 对 它 进 行 增 1 操 作 ， 使 其 成 为 !， 然 后 子 进程 对 
其 进行 增 1 操 作 ， 使 其 成 为 2， 然 后 父 进程 使 其 成 为 3…… 注 意 ， 当 在 update 函 数 中 对 长 整 型 什 
增 1 时 ， 因 为 增加 的 是 其 值 ， 而 不 是 指针 ， 所 以 必须 使 用 括号 。 

以 上 述 方式 使 用 /dev/zero 的 优点 是 : 在 调用 mmap 创 建 映射 区 之 前 ， 无 需 存 在 一 个 实际 
文件 。 映 射 /dev/zero 自 动 创建 一 个 指定 长 度 的 映射 区 。 这 种 技术 的 缺点 是 : 它 只 在 相关 进 
程 间 起 作用 。 但 在 相关 进程 之 间 使 用 线程 (第 11 章 和 第 12 章 ) 可 能 更 为 简单 、 有 效 。 注 意 ， 无 
论 使 用 哪 一 种 技术 ， 都 需 对 共享 数据 进行 同步 访问 。 口 


KP: 匿名 存储 映射 


很 多 实现 提供 了 一 种 类 似 于 /dev/zero 的 设施 ， 称 为 匿名 存储 映射 。 为 了 使 用 这 种 功能 ， 
在 调用 mmap 时 指定 MAP_ANON 标 志 ， 并 将 文件 描述 符 指定 为 -1。 结 果 得 到 的 区 域 是 匿名 的 (A 
为 它 并 不 通过 一 个 文件 描述 符 与 一 个 路 径 名 相 结合 ) ， 并 且 创 建 一 个 可 与 后 代 进 程 共 享 的 存储 区 。 


本 书 讨论 的 四 种 平台 都 支持 匿名 存储 映射 。 但 是 注意 . Linux 为 此 定义 了 MAP_ANONYMOUS 标 志 ， 
并 将 MAP_ANON 标 志 定 义 为 与 它 相 同 的 值 以 改善 应 用 的 可 移植 性 。 


为 使 程序 清单 15-12 所 示 程 序 应 用 这 种 特征 ， 对 它 做 了 三 处 修改 ，; 一 是 删除 了 对 于 
/dev/zero 的 open 语 句 ， 二 是 删除 了 对 于 fd 的 close 语 句 ， 三 是 将 mmap 调 用 修改 成 


if ((area = mmap (0, SIZE, PROT_READ | PROT_WRITE, 
MAP ANON | MAP SHARED, -1, 0)) == MAP FAILED) 


的 形式 。 在 此 调用 中 ， 指 定 了 MAP_ANON 标 志 ， 并 将 文件 描述 符 取 为 -1。 程 序 的 其 余部 分 则 没 
有 改变 。 D 


最 后 两 个 例子 说 明了 在 多 个 相关 进程 之 间 如 何 使 用 共享 存储 段 。 如 果 在 无 关 进 程 之 间 使 用 
共享 存储 段 ， 那 么 有 两 种 替换 的 方法 。 其 一 是 应 用 程序 使 用 XSI 共 享 存储 函数 ， 另 一 种 是 使 用 
mmap 将 同一 文件 映射 至 它们 的 地 址 空间 ， 为 此 使 用 MAP_SHARED 标 志 。 


15.10 客户 进程 -服务 器 进程 属性 


下 面 详细 说 明 客 户 进程 和 服务 器 进程 的 某 些 属性 ， 这 些 属性 受到 它们 之 间 所 使 用 的 IPC 类 
型 的 影响 。 最 简单 的 关系 类 型 是 使 客户 调用 fork 然 后 调用 exec 执 行 所 希望 的 服务 器 进程 。 在 
foxk 之 前 先 创建 两 个 半 双 工 管道 使 数据 可 在 两 个 方向 传输 。 图 15-8 是 这 种 形式 的 一 个 例子 。 被 
执行 的 服务 器 程序 可 能 是 设置 用 户 ID 的 程序 ， 这 使 它 具有 了 特权 。 服 务 器 进程 查看 客户 进程 的 
实际 用 户 IDP 就 可 以 决定 客户 进程 的 身份 。( 回 忆 8.10 节 ， 从 中 可 了 解 到 在 exec 前 后 实际 用 户 ID 
和 实际 组 ID 并 没有 改变 。) 

在 这 种 安排 下 ， 可 以 构筑 一 个 开放 式 服 务 器 (open server)。(17.5 节 提供 了 这 种 客户 和 服 
务 器 的 一 种 实现 ) 。 它 为 客户 进程 打开 文件 而 不 是 客户 进程 自己 调用 open 函 数 。 这 样 就 可 以 在 
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正常 的 UNIX 用 户 /组 /其 他 权限 之 上 或 之 外 ， 增 加 附加 的 权限 检查 。 假 定 服务 器 进程 执行 的 是 设 
置 用 户 ID 程序 ， 这 给 予 了 它 附 加 的 权限 (很 可 能 是 root 权 限 )。 服 务 器 进程 用 客户 进程 的 实际 用 
户 ID 以 决定 是 否 给 予 它 对 所 请 求 文件 的 访问 权限 。 使 用 这 种 方式 ， 可 以 构筑 一 个 服务 器 进程 ， 
它 允 许 某 种 用 户 获 得 通常 没有 的 访问 权限 。 

在 此 例子 中 ， 因 为 服务 器 进程 是 父 进程 的 子 进程 ， 所 以 它 能 做 的 一 切 是 将 文件 内 容 传 送 给 
父 进程 。 这 种 方式 对 普通 文件 完全 够 用 ， 但 是 对 特殊 设备 文件 却 不 能 工作 。 我 们 希望 能 做 的 是 
使 服务 器 进程 打开 所 要 的 文件 ， 并 送 回 文件 描述 符 。 但 是 实际 情况 却 是 父 进程 可 向 子 进程 传送 
打开 文件 描述 符 ， 而 子 进程 则 不 能 向 父 进程 传 回 文件 描述 符 (除非 使 用 将 在 第 17 章 介绍 的 专门 
编程 技术 ) 。 

图 15-12 中 示 出 了 另 一 种 类 型 的 服务 器 进程 。 这 种 服务 器 进程 是 一 个 守护 进程 ， 所 有 客户 进 
程 用 某 种 形式 的 IPC 与 其 联系 。 对 于 这 种 形式 的 客户 进程 -服务 器 进程 关系 ， 不 能 使 用 管道 。 要 
求 使 用 命名 的 IPC， 例 如 FIFO 或 消息 队列 。 对 于 FIFO， 如 果 服 务 器 进程 必须 将 数据 送 回 客户 进 
程 ， 则 对 每 个 客户 进程 都 要 有 单独 使 用 的 FIFO。 如 果 客 户 进程 -服务 器 进程 应 用 程序 只 有 客户 
进程 向 服务 器 进程 发 送 数据 ， 则 只 需要 一 个 众所周知 的 FIFO。 (系统 V 行 式 打印 机 假 脱 机 程序 
使 用 这 种 形式 的 客户 进程 -服务 器 进程 。 客 户 进程 是 1P(1) 命 令 ， 服 务 器 进程 是 1psched 守 护 进 
程 。 因 为 只 有 从 客户 进程 到 服务 器 进程 的 数据 流 ， 没 有 任何 数据 需 送 回 客户 进程 ， 所 有 只 需 使 
用 一 个 FIFO 。) 

使 用 消息 队列 则 存在 多 种 可 能 性 : 

(1) 在 服务 器 进程 和 所 有 客户 进程 之 间 只 使 用 一 个 队列 ， 使 用 消息 的 类 型 字段 指明 谁 是 消 
息 的 接收 者 。 例 如 ， 客 户 进 程 可 以 用 类 型 字段 1 发 送 它 们 的 消息 。 在 请 求 之 中 应 包括 客户 进程 
的 进程 ID。 此 后 ， 服 务 器 进程 在 发 送 响 应 消息 时 ， 将 类 型 字段 设置 为 客户 进程 的 进程 ID。 服 务 
器 进程 只 接收 类 型 字段 为 1 的 消息 (msgrcv 的 第 四 个 参数 ) ， 客 户 进 程 则 只 接收 类 型 字段 等 于 
它 进程 卫 的 消息 。 

(2) 另 一 种 方法 是 每 个 客户 进程 使 用 一 个 单独 的 消息 队列 。 在 向 服务 器 进程 发 送 第 一 个 请 
求 之 前 ， 每 个 客户 进程 先 创 建 它 自己 的 消息 队列 ， 创 建 时 使 用 键 IPC_PRIVRATE。 服 务 器 进程 
也 有 它 自己 的 队列 ， 其 键 或 标识 符 是 所 有 客户 进程 都 知道 的 。 客 户 进程 将 其 第 一 个 请 求 送 到 服 
务 器 进程 的 众所周知 的 队列 上 ， 该 请 求 中 应 包含 其 客户 进程 消息 队列 的 队列 ID 。 服 务 器 进程 将 
其 第 一 个 响应 送 至 客户 进程 队列 ， 此 后 的 所 有 请 求 和 响应 都 在 此 队列 上 交换 。 

使 用 这 种 技术 的 一 个 问题 是 : 每 个 客户 进程 专用 队列 通常 只 有 一 个 消息 在 其 中 一 一 或 者 是 
对 服务 器 进程 的 一 个 请 求 ， 或 者 是 对 客户 进程 的 响应 。 这 似乎 是 对 有 限 的 系统 资源 (消息 队列 ) 
的 浪费 ， 为 此 可 以 用 一 个 FIFO 来 代替 。 另 一 个 问题 是 服务 器 进程 需 从 多 个 队列 读 消息 。 对 于 消 
息 队 列 ，select 和 po11 都 不 起 作用 。 

使 用 消息 队列 的 这 两 种 技术 都 可 以 用 共享 存储 段 和 同步 方法 〈 信 和 号 量 或 记录 锁 ) 实现 。 

这 种 类 型 的 客户 进程 -服务 器 进程 关系 (客户 进程 和 服务 器 进程 是 无 关系 进程 ) 的 问题 是 : 
服务 器 进程 如 何 准 确 地 标识 客户 进程 ”除非 服务 器 进程 正在 执行 一 种 非特 权 操 作 ， 否 则 服务 器 
进程 知道 客户 进程 的 身份 是 很 重要 的 。 例 如 ， 若 服务 器 进程 是 一 个 设置 用 户 ID 程序 ， 就 有 这 种 
要 求 。 虽 然 ， 所 有 这 几 种 形式 的 IPC 都 经 由 内 核 ， 但 是 它们 并 未 提供 任何 措施 使 内 核能 够 标识 

对 于 消息 队列 ， 如 果 在 客户 进程 和 服务 器 进程 之 间 使 用 一 个 专用 队列 (于 是 一 次 只 有 一 个 
消息 在 该 队列 上 )， 那 么 队列 的 msg_1lspid 包 含 了 对 方 进程 的 进程 ID。 但 是 当 客户 进程 将 请 求 
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发 送 给 服务 器 进程 时 ， 我 们 想 要 的 是 客户 进程 的 有 效用 户 ID， 而 不 是 它 的 进程 ID。 现 在 还 没有 
一 种 可 移植 的 方法 ， 在 已 知 进程 ID 的 情况 下 可 以 得 到 有 效用 户 ID。( 内 核 在 进程 表 项 中 自然 地 
保持 有 这 两 种 值 ， 但 是 除非 彻底 检查 内 核 存储 空间 ， 否 则 已 知 一 个 ， 无 法 得 到 另 一 个 。) 

我 们 将 在 17.3 节 中 使 用 下 列 技术 ,使 服务 器 进程 可 以 标识 客户 进程 。 这 一 技术 既 可 使 用 FIFO、 
消息 队列 或 信号 量 ， 也 可 使 用 共享 存储 。 在 下 面 的 说 明 中 假定 按 图 15-12 使 用 了 FIFO。 客 户 进 
程 必须 创建 它 自己 的 FIFO， 并 且 设 置 该 FIFO 的 文件 访问 权限 ， 使 得 只 允许 用 户 读 ， 用 户 写 。 
假定 服务 器 进程 具有 超级 用 户 特权 (或 者 它 很 可 能 并 不 关心 客户 进程 的 真实 标识 ) ， 所 以 服务 
器 进程 仍 可 读 、 写 此 FIFO。 当 服务 器 进程 在 众所周知 的 FIFO 上 接收 到 客户 进程 的 第 一 个 请 求 
时 ( 它 应 当 包 含 客户 进程 专用 FIFO 的 标识 ) ， 服 务 器 进程 调用 针对 客户 进程 专用 FIFO 的 stat 或 
fstat。 服 务 器 进程 假设 客户 进程 的 有 效用 户 ID 是 FIFO 的 所 有 者 (stat 结 构 的 st_uid 字 段 )。 
服务 器 进程 验证 该 FIFO 只 有 用 户 读 、 用 户 写 权限 。 服 务 器 进程 还 应 检查 该 FIFO 的 三 个 时 间 量 
(stat 结 构 中 的 st_atime，st_mtime 和 st_ctime 字 段 )， 要 检查 它们 与 当前 时 间 是 否 很 接 
近 【 例 如 不 早 于 当前 时 间 15s 或 30s) 。 如 果 一 个 有 预谋 的 客户 进程 可 以 创建 一 个 FIFO， 使 另 一 
个 用 户 成 为 其 所 有 者 ， 并 且 设 置 该 文件 的 权限 为 用 户 读 和 用 户 写 ， 那 么 在 系统 中 就 存在 了 其 他 
基础 性 的 安全 问题 。 

为 了 用 XSI IPC 实 现 这 种 技术 ， 回 想 一 下 与 每 个 消息 队列 、 信 和 号 量 以 及 共享 存储 段 相关 的 
ipc_perm 结 构 ， 其 中 cuid 和 cgid 字 段 标识 IPC 结 构 的 创建 者 。 以 FIFO 为 例 ， 服 务 器 进程 应 
当 要 求 客户 进程 创建 该 IPC 结 构 ， 并 使 客户 进程 将 访问 权限 设置 为 只 允许 用 户 读 和 用 户 写 。 服 
务 器 进程 也 应 检验 与 该 IPC 相 关 的 时 间 值 与 当前 时 间 是 否 很 接近 (因为 这 些 IPC 结 构 在 显 式 地 删 
除 之 前 一 直 存在 ) 。 

在 17.2.2 节 中 ， 将 会 看 到 进行 这 种 身份 验证 的 一 种 更 好 的 方法 ， 其 关键 是 内 核 提供 客户 进 
程 的 有 效用 户 ID 和 有 效 组 也。STREAMS 子 系统 在 进程 之 间 传 送 文件 描述 符 时 可 以 做 到 这 一 点 。 


15.11 小 结 


本 章 详 细 说 明了 进程 间 通 信 的 多 种 形式 : 管道 、 命 名 管道 (FIFO) 以 及 另外 三 种 IPC 形 式 
(通常 称 为 XSI IPC) ， 即 消息 队列 、 信 号 量 和 共享 存储 。 信 和 号 量 实际 上 是 同步 原 语 而 不 是 IPC， 
常用 于 共享 资源 (例如 共享 存储 段 ) 的 同步 访问 。 对 于 管道 ， 我 们 说 明了 popen 函 数 的 实现 ， 
说 明了 协同 进程 ， 以 及 使 用 标准 VO 库 缓冲 机 制 时 可 能 遇 到 的 问题 。 

将 消息 队列 对 全 双 工 管道 、 信 号 量 对 记录 锁 等 不 同方 法 的 耗 时 做 了 比较 ， 然 后 提出 了 下 列 建 
议 : 要 学 会 使 用 管道 和 FIFO， 因 为 在 大 量 应 用 程序 中 仍 可 有 效 地 使 用 这 两 种 基本 技术 。 在 新 的 应 
用 程序 中 ， 要 尽 可 能 避免 使 用 消息 队列 以 及 信号 量 ， 而 应 当 考 虑 全 双 工 管道 和 记录 锁 ， 它 们 使 用 
起 来 会 简单 得 多 。 共 享 存储 段 有 其 应 用 场合 ， 而 mmap 函 数 ( 见 14.9 节 ) 也 能 提供 同样 的 功能 。 

下 一 章 将 介绍 网 络 IPC， 它 们 使 进程 能 够 跨越 计算 机 的 边界 进行 通信 。 


习题 
15.1 在 程序 清单 15-2 父 进程 代码 的 末尾 ， 如 果 有 删除 waitpid 前 的 close， 结 果 将 如 何 ? 
15.2 在 程序 清单 15-2 父 进程 代码 的 末尾 ， 如 果 删 除 waitpid， 结 果 将 如 何 ? 


15.3 如 果 popen 函 数 的 参数 是 一 个 不 存在 的 命令 ， 这 会 造成 什么 结果 ?编写 一 段 小 程序 对 此 
进行 测试 。 
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15.4 


15.5 
15.6 


15.7 


15.8 


15.9 


15.10 


15.11 


15.12 


15.13 
15.14 


15.15 
15.16 
15.17 


删除 程序 清单 15-9 中 的 信号 量 处 理 程 序 ， 执 行 该 程序 并 终止 子 进程 。 输 入 一 行 后 ， 怎 样 
才能 说 明 父 进程 是 由 SIGPIPE 终 止 的 ? 

将 程序 清单 15-9 中 进行 管道 读 、 写 的 read 和 write 用 标准 VO 库 代 赫 。 

POSIX.1 加 入 waitpid 函 数 的 理由 之 一 是 ，POSIX.1 之 前 的 大 多 数 系统 不 能 处 理 下 面 的 
代码 。 


if ((fp = popen("/bin/true", "r")) == NULL) 
if ((rc = system("sleep 100")) == -1) 


if (pelose(fp) == -1) 


若 在 这 段 代 码 中 不 使 用 waitpida 国 数 会 如 何 ?” 用 wait 代 替 昵 ? 
当 一 个 管道 被 写 进程 关闭 后 ， 解 释 select 和 po11 如 何 处 理 该 管道 的 输入 描述 符 。 编 两 
个 测试 程序 ， 一 个 用 select ， 另 一 个 用 po11， 并 判断 答案 是 否 正确 。 当 一 个 管道 的 读 
端 被 关闭 时 ， 请 重 做 此 习题 以 查看 该 管道 的 输出 描述 符 。 
如 果 popen 以 type 为 "r' 执 行 cmdstring， 并 将 结果 写 到 标准 出 错 输 出 ， 结 果 如 何 ? 
popen 函 数 能 使 shell 执 行 它 的 cmdstring 参 数 ， 当 cmdstring 终 止 时 会 产生 什么 结果 ? 
(提示 : 画 出 与 此 相关 的 所 有 进程 。) f 
大 多 数 UNIX 系 统 允 许 读 写 FIFO ， 但 是 POSIX.1 特 别 声明 没有 定义 为 读 写 而 打开 FIFO 。 
请 用 非 阻塞 方法 实现 为 读 写 而 打开 FIFO。 
除非 文件 包含 敏感 或 机 密 数 据 ， 否 则 人 允许 其 他 用 户 读 文件 不 会 造成 损害 。( 不 过 ， 宕 探 
别人 的 文件 总 归 是 不 良 行为 。) (但 是 ， 如 果 一 个 恶意 进程 读 取 了 被 一 个 服务 器 进程 和 几 
个 客户 进程 使 用 的 消息 队列 中 的 一 条 消息 后 ， 会 产生 什么 后 果 ? 恶意 进程 需要 知道 哪些 
信息 就 可 以 读 消 息 队 列 ? 
编写 一 段 程序 完成 下 面 的 工作 ; 执行 一 个 循环 5 次 ， 在 每 次 循环 中 ， 创 建 一 个 消息 队列 ， 
打印 该 队列 的 标识 符 ， 然 后 删除 队列 。 接 着 再 循环 5 次 ， 在 每 次 循环 中 利用 键 
IPC_PRIVATE 创 建 消息 队列 并 将 一 条 消息 放 在 队列 中 。 程 序 终止 后 用 ipcs(1) 查 看 消息 
队列 。 解 释 队 列 标识 符 的 变化 。 
描述 如 何在 共享 存储 段 中 建立 一 个 数据 对 象 的 链接 列表 。 列 表 指 针 如 何 保存 ? 
画 出 程序 清单 15-12 所 示 程 序 运行 时 下 列 值 随时 间 变 化 的 曲线 图 (假定 在 调用 fork 后 子 
进程 首先 运行 )， 这 些 值 是 ; 
(1) 在 父 进程 和 子 进程 中 的 变量 i， 
(2) 在 共享 存储 区 中 长 整 型 的 值 ， 
(3) update 函 数 的 返回 值 。 
使 用 15.9 节 中 的 XSI 共 享 存储 函数 代替 共享 存储 上 映射 区 ， 改 写 程序 清单 15-12。 
使 用 15.8 节 中 XSI 信 号 量 函 数 改 写 程序 清单 15-12， 实 现 父 进程 与 子 进程 间 的 交替 。 
使 用 建议 性 记录 锁 改 写 程序 清单 15-12， 实 现 父 进 程 与 子 进程 间 的 交替 。 
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16.1 引言 


上 一 章 考 查 了 各 种 UNIX 系 统 所 提供 的 经 典 进 程 间 通 信 (IPC) 机 制 ; 管道 、 先 进 先 出 、 消 
息 队 列 、 信 号 量 以 及 共享 内 存 。 通 过 这 些 机 制 ， 同 一 台 计 算 机 上 运行 的 进程 可 以 相互 通信 。 本 
章 将 考查 不 同 计算 机 (通过 网 络 相 连 ) 上 运行 的 进程 相互 通信 的 机 制 : 网 络 进程 间 通 信 
(network IPC ) 。 

在 本 章 中 ， 将 描述 套 接 字 网 络 IPC 接 口 ， 进 程 能 够 使 用 该 接口 和 其 他 进程 通信 。 通 过 该 接 
口 ， 其 他 进程 运行 位 置 是 透明 的 ， 它 们 可 以 在 同一 台 计 算 机 上 也 可 以 在 不 同 的 计算 机 上 。 实 际 
上 ， 这 正 是 套 接 字 接 口 的 目标 之 一 ， 同 样 的 接口 既 可 以 用 于 计算 机 间 通 信 又 可 以 用 于 计算 机 内 
通信 。 尽 管 套 接 字 接口 可 以 采用 许多 不 同 的 网 络 协议 ， 但 本 章 的 讨论 仅 限于 因特网 事实 上 的 通 
信 标 准 : TCP/IP 协 议 栈 。 

POSIX.1 所 规定 的 套 接 字 API 是 基于 4.4BSD 套 接 字 接口 的 。 尽 管 这 些 年 有 些微 小 变化 ， 但 
是 当前 的 套 接 字 接 口 与 20 世 纪 80 年 代 早期 4.2BSD 中 最 初 引 入 的 接口 仍然 非常 类 似 。 

本 章 只 是 对 套 接 字 API 的 概述 。Stevens、Fenner 和 Rudoff[2004] 在 有 关 UNIX 系 统 网 络 编程 
的 权威 性 文献 中 详细 讨论 了 套 接 字 接 只 。 


16.2 套 接 字 描 述 符 


套 接 字 是 通信 端点 的 抽象 。 与 应 用 程序 要 使 用 文件 描述 符 访问 文件 一 样 ， 访 问 套 接 字 也 需 
要 用 套 接 字 描 述 符 。 套 接 字 描 述 符 在 UNIX 系 统 是 用 文件 描述 符 实现 的 。 事 实 上 ,许多 处 理 文 
件 描 述 符 的 函数 (如 read 和 write) 都 可 以 处 理 套 接 字 描述 符 。 

要 创建 一 个 套 接 字 ， 可 以 调用 socket 函数 。 


#include «sys/socket.h» 


int socket (int domain, int type, int protocol) ; 


返回 值 : 车 成 功 则 返回 文件 〈 套 接 字 ) 描述 符 ， 车 出 错 则 返回 ~1 


参数 domain (5k) 确定 通信 的 特性 ， 包 括 地 址 格式 〈 在 下 一 小 节 详 细 讲述 ) 。 表 16-1 总 结 了 由 
POSIX.1 指 定 的 各 个 域 。 各 个 域 有 自己 的 格式 表示 地 址 ， 而 表示 各 个 域 的 常数 都 以 AF_ 开 头 ， 
意 指 地 址 族 (address family), 

UNIX 域 将 在 17.3 节 讨论 。 多 数 系 统 还 会 定义 AF_LOCAL 域 ， 这 是 AF_UNIX 的 别名 。 
AF_UNSPEC 域 可 以 代表 任何 域 。 历 史上 ， 有 些 平台 支持 其 他 网 络 协 议 (如 AF_IPX 为 NetWare 
协议 族 )， 但 这 些 协议 的 域 常数 没有 在 POSIX.1 标准 中 定义 。 
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表 16-1 套 接 字 通 信 域 


AF_INET IP v4 DS A P 


AE INED IPv6 因 特 网 域 
AF_UNIX UNIX 域 
AF_UNSPEC 未 指定 
参数 type 确 定 套 接 字 的 类 型 ， 进 一 步 确定 通信 特征 。 表 16-2 总 结 了 由 POSIX.1 定义 的 套 接 
字 类 型 ， 但 在 实现 中 可 以 自由 增加 对 其 他 类 型 的 支持 。 


表 16-2 套 接 字 类 型 





SOCK_DGRAM 长 度 固 定 的、 无 连接 的 不 可 靠 报 文 传递 


SOCK_RAW IP 协 议 的 数据 报 接口 (POSIX.1 中 为 可 选 ) 
SOCK_SEQPACKET 长 度 固 定 、 有 序 、 可 靠 的 面向 连接 报 文 传递 
SOCK_STREAM 有 序 、 可 靠 、 双 向 的 面向 连接 字 节 流 





参数 protoco! 通 常 是 零 ， 表 示 按 给 定 的 域 和 套 接 字 类 型 选择 默认 协议 。 当 对 同一 域 和 套 接 
字 类 型 支持 多 个 协议 时 ， 可 以 使 用 protocol 参 数 选择 一 个 特定 协议 。 在 AF_INET 通 信 域 中 套 接 
字 类 型 SOCK_STREAM 的 默认 协议 是 TCP (传输 控制 协议 ) 。 在 AF_INET 通 信 域 中 套 接 字 类 型 
SOCK_DGRAM 的 默认 协议 是 UDP (用 户 数据 报 协议 )。 

对 于 数据 报 (SOCK DGRAM) 接 只 ， 与 对 方 通信 时 是 不 需要 逻辑 连接 的 。 只 需要 送出 一 个 
报 文 ， 其 地 址 是 一 个 对 方 进程 所 使 用 的 套 接 字 。 

因此 数据 报 提供 了 一 个 无 连接 的 服务 。 另 一 方面 ， 字 节 流 (SOCK STREAM) 要 求 在 交换 
数据 之 前 ， 在 本 地 套 接 字 和 与 之 通信 的 远程 套 接 字 之 间 建 立 一 个 逻辑 连接 。 

数据 报 是 一 种 自 包 含 报 文 。 发 送 数据 报 近似 于 给 某 人 邮寄 信件 。 可 以 邮寄 很 多 信 ， 但 不 能 
保证 投递 的 次 序 ， 并 且 可 能 有 些 信 件 丢失 在 路 上 。 每 封 信 件 包含 接收 者 的 地 址 ， 使 这 封 信件 独 
立 于 所 有 其 他 信件 。 每 封 信件 可 能 送 达 不 同 的 接收 者 。 

相 比 之 下 ， 使 用 面向 连接 的 协议 通信 就 像 与 对 方 打 电 话 。 首 先 ， 需 要 通过 电话 建立 一 个 连 
接 ， 连 接 建立 好 之 后 ， 彼 此 能 双向 地 通信 。 每 个 连接 是 端 到 端的 通信 信道 。 会 话 中 不 包含 地 下 
信息 ， 就 像 呼叫 的 两 端 存在 一 个 点 对 点 虚拟 连接 ， 并 且 连 接 本 身上 暗含 特定 的 源 和 目的 地 。 

对 于 SOCK_STREAM 套 接 字 ， 应 用 程序 意识 不 到 报 文 界 限 ， 因 为 套 接 字 提 供 的 是 字 节 流 服 
务 。 这 意味 着 当 从 套 接 字 读 出 数据 时 ， 它 也 许 不 会 返回 所 有 由 发 送 进程 所 写 的 字 节 数 。 最 终 可 
以 获得 发 送 过 来 的 所 有 数据 ， 但 也 许 要 通过 若干 次 函数 调用 得 到 。 

SOCK_SEQPACKET 套 接 字 和 SOCK_STREAM 套 接 字 很 类 似 ， 但 从 该 套 接 字 得 到 的 是 基于 报 
文 的 服务 而 不 是 字 节 流 服务 。 这 意味 着 从 SOCK_SEQPACKET 套 接 字 接 收 的 数据 量 与 对 方 所 发 
送 的 一 致 。 流 控制 传输 协议 (Stream Control Transmission Protocol, SCTP) 提供 了 因特网 域 上 
的 顺序 数据 包 服 务 。 

SOCK_RAW 套 接 字 提供 一 个 数据 报 接口 用 于 直接 访问 下 面 的 网 络 层 (在 因特网 域 中 为 下)。 使 
用 这 个 接 只 时 ， 应 用 程序 负责 构造 自己 的 协议 首部 ， 这 是 因为 传输 协议 (TCP 和 UDP 等 ) 被 绕 过 了 。 
当 创 建 一 个 原始 套 接 字 时 需要 有 超级 用 户 特权 ， 用 以 防止 恶意 程序 绕 过 内 建安 全 机 制 来 创建 报 文 。 

调用 socket 与 调用 open 相 类 似 。 在 两 种 情况 下 ， 均 可 获得 用 于 输入 /输出 的 文件 描述 符 。 
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当 不 再 需要 该 文件 描述 符 时 ， 调 用 close 来 关闭 对 文件 或 套 接 字 的 访问 ， 并 且 释 放 该 描述 符 以 
便 重新 使 用 。 
虽然 套 接 字 描述 符 本 质 上 是 一 个 文件 描述 符 ， 但 不 是 所 有 参数 为 文件 描述 符 的 函数 都 可 以 
接受 套 接 字 描 述 符 。 表 16-3 总 结 了 到 目前 为 止 所 讨论 的 大 多 数 使 用 文件 描述 符 的 函数 处 理 套 接 
字 找 述 符 时 的 行为 。 未 规定 的 和 由 实现 定义 的 行为 通常 意味 着 函数 不 能 处 理 套 接 字 描 述 符 。 例 
如 ，1lseek 不 处 理 套 接 字 ， 因 为 套 接 字 不 支持 文件 偏 移 量 的 概念 。 


表 16-3 使 用 文件 描述 符 的 函数 处 理 套 接 宇 时 的 行为 


close (3.335) PERF 

dup, dup2 (3.12 45) 和 一 般 文件 描述 符 一 样 复制 

fchdir (4.2245) 失败 ， 并 且 将 errno 设 置 为 ENOTDIR 

fchmod (4.9 节 ) : 未 规定 

fchown (4.1145) 由 实现 定义 

fcntl (3.1445) 支持 一 些 命令 ， 例 如 F_DUPFD, F_GETFD, F_GETFL, 
_GETOWN, F_SETFD, F_SETFL, F_SETOWN 

fdatasync,fsync (3.1345) 由 实现 定义 

fstat (4245) 支持 一 些 stat 结 构成 员 ， 但 如 何 支 持 由 实现 定义 

ftruncate (4.13 节 ) 未 规定 

getmsg,getpmsg (14.445) 如 果 套 接 字 由 STREAMS 实 现 则 可 支持 ， 例 如 在 Solaris 平 台 上 

ioctl (3.1545) 支持 部 分 命令 ， 依 赖 于 底层 设备 驱动 

lseek (3.64%) 由 实现 定义 (通常 是 失败 并 且 将 errno 设 为 ESPIPE) 

mmap (14.945) 未 规定 

poll (14.5.2 小 节 ) 正常 工作 

putmsg, putpmsg (14.4 节 ) 如 果 套 接 字 由 STREAMS 实 现 则 可 支持 ， 例 如 在 Solaris 平 台 上 

read (3.7 节 ) 和 readv (14.745) 与 没有 任何 标志 位 的 recv (16.535) 等 价 

select (14.5.1 小 节 ) 正常 工作 

write (3.8 节 ) 和 writev (14.7 节 ) 与 没有 任何 标志 位 的 send (16.535) 等 价 


套 接 字 通 信和 是 双向 的 。 可 以 采用 函数 shutdown 来 禁止 套 接 字 上 的 输入 输出 。 


#include <sys/socket.h> 





int shutdown(int sockfd, int how); 


返回 值 : ARAM MO, AH eM eI 


如 果 how 是 SHUT_RD (关闭 读 端 )， 那 么 无 法 从 套 接 字 读 取 数 据 ， 如 果 how 是 SHUT_WR (关闭 写 
端 ) ， 那 么 无 法 使 用 套 接 字 发 送 数据 ， 使 用 SHUT_RDWR 则 将 同时 无 法 读 取 和 发 送 数据 。 
能 够 close (KA) 套 接 字 ， 为 何 还 使 用 shutdown 了 昵 ? 理由 如 下 ;, 首先 ，close 只 有 在 
最 后 一 个 活动 引用 被 关闭 时 才 释 放 网 络 端点 。 这 意味 着 如 果 复 制 一 个 套 接 字 (例如 采用 aup)， [548 
套 接 字 直 到 关闭 了 最 后 一 个 引用 它 的 文件 描述 符 之 后 才 会 被 释放 。 而 shutdown 人 允许 使 一 个 套 
接 字 处 于 不 活动 状态 ， 无 论 引 用 它 的 文件 描述 符 数 目 多 少 。 其 次 ， 有 时 只 关闭 套 接 字 双 向 传输 
中 的 一 个 方向 会 很 方便 。 例 如 ， 如 果 想 让 所 通信 的 进程 能 够 确定 数据 发 送 何 时 结束 ， 可 以 关闭 
该 套 接 字 的 写 端 ， 然 而 通过 该 套 接 字 读 端 仍 可 以 继续 接收 数据 。 


16.3 ik 
上 一 节 中 学 习 了 如 何 创建 和 销毁 一 个 套 接 字 。 在 学 习 用 套 接 字 做 一 些 有 意义 的 事情 之 前 ， 
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需要 知道 如 何 确定 一 个 目标 通信 进程 。 进 程 的 标识 有 两 个 部 分 : 计算 机 的 网 络 地 址 可 以 帮助 标 
识 网 络 上 想 与 之 通信 的 计算 机 ， 而 服务 可 以 帮助 标识 计算 机 上 特定 的 进程 。 
16.3.1 ZPF 


运行 在 同一 台 计算 机 上 的 进程 相互 通信 时 ， 一 般 不 用 考虑 字 节 的 顺序 ( 字 节 序 )， 字 节 序 
是 一 个 处 理 器 架构 特性 ， 用 于 指示 像 整 数 这 样 的 大 数据 类 型 的 内 部 字 节 顺序 。 图 16-1 显 示 一 个 
32 位 整数 内 部 的 字 节 是 如 何 排序 的 。 





如 果 处 理 器 架构 支持 大 端 (big-endian) 字 节 序 ， 那 么 最 大 ER 
字 节 地 址 对 应 于 数字 最 低 有 效 字 节 (LSB) Eb, b (little- | n niini ma 
endian) 字 节 序 则 相反 ,数字 最 低 字 节 对 应 于 最 小 字 节 地 址 。 注 hee ase 


意 ， 不 管 字 节 如 何 排序 ， 数 字 最 高 位 总 是 在 左边 ， 最 低位 总 是 


在 右边 。 因 此 ， 如 果 想 给 一 个 32 位 整数 赋值 0x04030201， 不 . 
管 字 节 如 何 排序 ， 数 字 最 高 位 包含 4， 数 字 最 低位 包含 1， 如 果 
接着 想 将 一 个 字符 指针 (cp) 强制 转换 到 这 个 整数 的 地 址 ， 将 <= 
看 到 字 节 序 带 来 的 不 同 。 在 小 端 守节 序 的 处 理 器 上 ，cp10] 指 
向 数字 最 低位 因而 包含 1，cp [3 ] 指向 数字 最 高 位 因而 包含 4。 图 16-1 32 位 整数 内 部 的 字 节 序 
相 比较 而 言 ， 对 于 大 端 字 节 序 的 处 理 器 ，cp [ 01 指向 数字 最 高 位 因而 包含 4，cp [3] 指向 数字 
最 低位 因而 包含 1。 表 16-4 总 结 了 本 文 所 讨论 的 4 种 平台 的 字 节 序 。 

K164 测试 平台 的 字 节 序 


操作 系统 处 理 器 架构 































FreeBSD 5.2.1 Intel Pentium 小 端 
Linux 2.4.22 lntel Pentium 小 端 
Mac OS X 10.3 PowerPC 大 端 








Solaris 9 Sun SPARC 大 端 






ERR ET AR ERK KH, RAK LM, = 


网 络 协议 指定 了 字 节 序 ， 因 此 异 构 计算 机 系统 能 够 交换 协议 信息 而 不 会 混淆 字 节 序 。 
TCP/IP 协 议 栈 采用 大 端 字 节 序 。 应 用 程序 交换 格式 化 数据 时 ， 字 节 序 问题 就 会 出 现 。 对 于 
TCP/IP， 地 址 用 网 络 字 节 序 来 表示 ， 所 以 应 用 程序 有 时 需要 在 处 理 器 的 字 节 序 与 网 络 字 节 序 之 
间 的 转换 。 例 如 ， 当 打印 一 个 易于 阅读 的 地 址 时 ， 这 种 转换 是 很 平常 的 。 

对 于 TCP/IP 应 用 程序 ， 提 供 了 四 个 通用 函数 以 实施 在 处 理 器 字 节 序 和 网 络 字 节 序 之 间 的 转换 。 





#include «arpa/inet.h» 









uint32 t htonl(uint32 t hostint32) ; 





返回 值 :以 网 络 字 节 序 表示 的 32 位 整 型 数 





uint16 t htons(uint16 t hostint16) ; 






返回 值 : 以 网 络 字 节 序 表示 的 16 位 整 型 数 






uint32 t ntohl(uint32 t netint32) ; 






返回 值 : 以 主机 字 节 序 表示 的 32 位 整 型 数 






uinti6 t ntohs(uint16 t netint16) ; 





返回 值 : 以 主机 字 节 序 表示 的 16 位 整 型 数 
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h 表 示 “ 主 机 (host)” 字 节 序 ，n 表 示 “ 网 络 (network)” 字 节 序 。1 表 示 “ 长 (long) ”整数 
( 即 4 个 字 节 ) ，s 表 示 “ 短 (short)” 整 数 ( 即 2 个 字 节 )。 这 4 个 函数 定义 在 <arpa/inet .nh> 中 ， 
也 有 比较 老 的 系统 将 其 定义 在 <netinet/in.h> 中 。 550 


16.3.2 地 址 格式 


地 址 标识 了 特定 通信 域 中 的 套 接 字 端点 ， 地 址 格式 与 特定 的 通信 域 相关 。 为 使 不 同 格式 地 
址 能 够 被 传 信 到 套 接 字 函 数 ， 地 址 被 强制 转换 成 通用 的 地 址 结构 sockaddr 表 示 ， 


struct gockaddr { 
sa family t sa family; /* address family */ 
char sa datal]; /* variable-length address */ 


he 
套 接 字 实现 可 以 自由 地 添加 额外 的 成 员 并 且 定义 sa_aata 成 员 的 大 小 。 例 如 在 Linux 中 ， 该 结 
构 定 义 如 下 ; 


struct sockaddr { 
sa family t sa family; /* address family */ 
char sa data[14]; /* variable-length address */ 


}; 
而 在 FreeBSD 中 ， 该 结构 定义 如 下 : 


struct sockaddr { 


unsigned char sa_len; /* total length */ 
sa family t sa family; /* address family */ 
char 8a data[14]; /* variable-length address */ 


因特网 地 址 定义 在 <netinet/in.h> 中 。 在 IPv4 因特网 域 (AF_INET) 中 ， 套 接 字 地 址 
用 如 下 结构 sockaqddr_ in 表 示 : 


struct in_addr { 
in_addr_t s_addr; /* IPv4 address */ 


h 


struct sockaddr in { 


sa family t sin family; /* address family */ 
in port t sin port; /* port number */ 
struct in_addr sin addr; /* IPv4 address */ 


h 
数据 类 型 in_port_t 定 义 成 uint16_t。 数 据 类 型 in_addr_t 定 义 成 uint32_t。 这 些 整数 
类 型 在 <stdint.h> 中 定义 并 指定 了 相应 的 位 数 。 


与 IPv4 因 特 网 域 (AF INET) 相 比 较 ，IPv6 因 特 网 域 (AF_INET6) 套 接 字 地 址 用 如 下 结 
构 sockaddr_in6 表 示 : 


struct in6 addr { 


uint8 t 86 addr[16]; /* IPv6 address */ 
}; 551 
struct sockaddr in6 { 

sa family t sin6 family; /* address family */ 

in port t sin6 port; /* port number */ 
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uint32 t sin6 flowinfo; /* traffic class and flow info */ 
struct in6 addr sin6 addr; /* IPv6 address */ 


uint32 t Sin6 scope id; /* set of interfaces for scope */ 


}; 


这 些 是 Single UNIX Specification 必 需 的 定义 ， 每 个 实现 可 以 自由 地 添加 额外 的 字段 。 例 如 ， 在 
Linux 中 ，sockaddr_in 定 义 如 下 ; 


struct sockaddr_in { 


sa family t Sin family; /* address family */ 
in port t sin port; /* port number */ 
struct in_addr sin addr; /* IPv4 address */ 


unsigned char sin zero[8]; /* filler */ 


其 中 成 员 sin_zero 为 填充 字段 ， 必 须 全 部 被 置 为 0。 

注意 ， 尽 管 sockaddr_in 与 90ockaddr_in6 相 差 比 较 大 ， 它 们 均 被 强制 转换 成 
sockaddr 结 构 传 人 到 套 接 字 例 程 中 。 在 17.3 节 ， 将 会 看 到 UNIX 域 套 接 字 地 址 与 上 述 因 特 网 域 
套 接 字 地 址 格式 的 不 同 。 

有 了 时， 需要 打印 出 能 被 人 而 不 是 计算 机 所 理解 的 地 址 格式 。BSD 网 络 软 件 中 包含 了 函数 
inet_adadqr 和 inet_ntoa， 用 于 在 二 进 制 地 址 格式 与 点 分 十 进 制 字符 串 表 示 (a.b.c.d) 之 间 
相互 转换 。 这 些 函 数 仅 用 于 IPv4 地 址 ， 但 功能 相似 的 两 个 新 函数 inet_ntcp 和 inet_pton 支 
持 IPv4 和 IPv6 地 址 。 


#include «arpa/inet.h» 


const char *inet_ntop(int domain, const void *restrict addr, 
char *restrict str, socklen_t size); 


返回 值 : 车 成 功 则 返回 地 址 字符 串 指针 ， 车 出 错 则 返回 NULL 


int inet pton(int domain, const char *restrict str, 
void *restrict addr); 


返回 值 ; 车 成 功 则 返回 1， 若 格式 无 效 则 返回 0， 若 出 错 则 返回 一 1 





函数 jnet_ntop 将 网 络 字 节 序 的 二 进 制 地 址 转换 成 文本 字符 申 格 式 ，inet_pton 将 文本 
字符 串 格式 转换 成 网 络 字 节 序 的 二 进 制 地 址 。 参 数 domain 仅 支持 两 个 值 ，AF_INET 和 RAF_ 
INET6, 

对 于 inet_ntop， 参 数 size 指 定 了 用 以 保存 文本 字符 串 的 缓冲 区 (str) 的 大 小 。 两 个 常数 
用 于 简化 工作 : INET_ADDRSTRLEN 定 义 了 足够 大 的 空间 来 存放 表示 IPv4 地 址 的 文本 字符 申 ， 
INET6_ADDRSTRLEN 定 义 了 足够 大 的 空间 来 存放 表示 IPv6 地 址 的 文本 字符 串 。 对 于 
inet_pton， 如 果 domain 是 AF_INET， 缓 冲 区 addr 需 要 有 足够 大 的 空间 来 存放 32 位 地 址 ， 如 
果 domain 为 AF_INET6 则 需要 足够 大 的 空间 来 存放 128 位 地 址 。 


16.3.3 地 址 查询 


理想 情况 下 ， 应 用 程序 不 需要 了 解 套 接 字 地 址 的 内 部 结构 。 如 果 应 用 程序 只 是 简单 地 传递 
类 似 于 sockadar 结 构 的 套 接 字 地 址 ， 并 且 不 依赖 于 任何 协议 相关 的 特性 ， 那 么 可 以 与 提供 相 
同 服务 的 许多 不 同 协 议 协 作 。 

历史 上 ，BSD 网 络 软件 提供 接口 访问 各 种 网 络 配置 信息 。 在 6.7 节 ， 简 要 地 讨论 了 网 络 数据 
文件 和 用 来 访问 这 种 信息 的 函数 。 在 本 节 ， 将 更 加 详细 地 讨论 一 些 细节 ， 并 且 引 入 新 的 函数 来 
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查询 寻 址 信息 。 

这 些 函 数 返 回 的 网 络 配置 信息 可 能 存放 在 许多 地 方 。 它 们 可 以 保存 在 静态 文件 中 (如 
/etc/hosts, /etc/services#), 或 者 可 以 由 命名 服务 管理 ， 例 如 PNS (Domain Name 
System) 或 者 NIS (Network Information Service)。 无 论 这 些 信 息 放 在 何 处 ， 这 些 函 数 同 样 能 够 
访问 它们 。 

通过 调用 gethostent， 可 以 找到 给 定 计 算 机 的 主机 信息 。 


#include <netdb.h> 


struct hostent *gethostent (void); 


返回 值 ， 若 成 功 则 返回 指针 ， 若 出 错 则 返回 NULL 


void sethostent (int stayopen) ; 


void endhostent (void) ; 





如 果 主 机 数据 文件 没有 打开 ，gethostent 会 打开 它 。 函 数 gethostent 返 回 文件 的 下 一 个 条 
目 。 函 数 sethostent 会 打开 文件 ， 如 果 文 件 已 经 被 打开 ， 那 么 将 其 回 绕 。 函 数 endhostent 
将 关闭 文件 。 

当 gethostent 返 回 时 ， 得 到 一 个 指向 hostent 结 构 的 指针 ， 该 结构 可 能 包含 一 个 静态 的 数 
据 缓冲 区 。 每 次 调用 gechostent 将 会 牙 盖 这 个 缓冲 区 。 数 据 结构 hostent 至 少 包含 如 下 成 员 ， 


struct hostent { 


char *h name; /* name of host */ 

char **h aliases; /* pointer to alternate host name array */ 
int h addrtype; /* address type */ 

int h length; /* length in bytes of address */ 


char **h addr list; /* pointer to array of network addresses */ 


E 
返回 的 地 址 采用 网 络 字 节 序 。 

两 个 附加 的 函数 gethostbyname 和 gethostbyaddr， 原 来 包含 在 hostent 函 数 里 面 ， 
现在 被 认为 是 过 时 的 ， 马 上 将 会 看 到 其 替代 函数 。 

能 够 采用 一 套 相 似 的 接口 来 获得 网 络 名 字 和 网 络 号 。 


#include «netdb.h» 


struct netent *getnetbyaddr(uint32 t nel, int type); 


struct netent *getnetbyname (const char *name) ; 
struct netent *getnetent (void) ; 

以 上 三 个 函数 的 返回 值 ， 若 成 功 则 返回 指针 ， 若 出 错 则 返回 NULL 
void setnetent (int stayopen) ; 


void endnetent (void) ; 


结构 netent 至 少 包含 如 下 字段 : 


struct netent { 
char *n_name; /* network name */ 
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char **n aliases; /* alternate network name array pointer */ 
int n addrtype; /* address type */ 
uint32 t n net; /* network number */ 


h 

网 络 号 按照 网 络 字 节 序 返 回 。 地 址 类 型 是 一 个 地 址 族 常量 (例如 AF_INET)。 
可 以 将 协议 名 字 和 协议 号 采用 以 下 函数 映射 。 
#include <netdb.h> 


struct protoent *getprotobyname (const char *name) ; 


struct protoent *getprotobynumber (int proto); 


struct protoent *getprotoent (void) ; 
以 上 所 有 函数 的 返回 值 ， 若 成 功 则 返回 指针 ， 若 出 错 则 返回 NULL 
void setprotoent (int stayopen) ; 


void endprotoent (void) ; 








POSIX.1 定 义 的 结构 protoent 至 少 包含 如 下 成 员 : 


struct protoent { 


char *p_name; /* protocol name */ 
char **p aliases; /* pointer to alternate protocol name array */ 


int p proto; /* protocol number */ 


) 


服务 是 由 地 址 的 端口 号 部 分 表示 的 。 每 个 服务 由 一 个 唯一 的 、 熟 知 的 端口 号 来 提供 。 采 用 
图 数 getservbyname 可 以 将 一 个 服务 名 字 映 射 到 一 个 端 日 号 ， 函 数 getservbyport 将 一 个 
端口 号 映射 到 一 个 服务 名 ,或 者 采用 函数 getservent 顺 序 扫 描 服务 数据 库 。 


#include <netdb.h> 


struct servent *getservbyname(const char *name, const char *proto) ; 
struct servent *getservbyport (int port, const char *proto) ; 


struct servent *getservent (void); 


以 上 所 有 函数 的 返回 值 ， 若 成 功 则 返回 指针 ， 若 出 错 则 返回 NULL 


void setservent (int stayopen) ; 


void endservent (void) ; 





结构 servent 至 少 包 含 如 下 成 员 ， 


struct servent { 


char ‘*s name; /* service name */ 

char **s aliases; /* pointer to alternate service name array */ 
int 8 port; /* port number */ 

char *s proto; /* name of protocol */ 


bbs.theithome.com 








163 $ 址 445 





POSIX.1 定 义 了 若干 新 的 函数 ， 人 允许 应 用 程序 将 一 个 主机 名 字 和 服务 名 字 映 射 到 一 个 地 址 ， 
或 者 相反 。 这 些 函 数 代 替 老 的 函数 gethostbyname 和 gethostbyadar。 
函数 getaddrinfo 人 允许 将 一 个 主机 名 字 和 服务 名 字 映 射 到 一 个 地 址 。 


#include <sys/socket .h> 
#include <netdb.h> 


int getaddrinfo(const char *restrict host, 
const char *restrict service, 
const struct addrinfo *restrict hint, 
struct addrinfo **restrict res); 


返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 非 0 错误 码 


void freeaddrinfo(struct addrinfo *ai) ; 


需要 提供 主机 名 字 、 服 务 名 字 ， 或 者 两 者 都 提供 。 如 果 仅 仅 提供 一 个 名 字 ， 另 外 一 个 必须 是 一 
个 空 指针 。 主 机 名 字 可 以 是 一 个 节点 名 或 点 分 十 进 制 记 法 表示 的 主机 地 址 。 

函数 getaddrinfo 返 回 一 个 结构 addrinfo 的 链表 。 可 以 用 freeaddrinfo 来 释放 一 个 
或 多 个 这 种 结构 ， 这 取决 于 用 ai_next 字 段 链接 起 来 的 结构 有 多 少 。 

结构 adarinfo 的 定义 至 少 包含 如 下 成 员 ， 


struct addrinfo { 


int ai_flags; /* customize behavior */ 

int ai_family; /* address family */ 

int ai socktype; /* socket type */ 

int ai protocol; /* protocol */ 

socklen t ai addrlen; /* length in bytes of address */ 
struct sockaddr  *ai addr; /* address */ 

char *ai canonname; /* canonical name of host */ 
struct addrinfo  *ai next; /* next in list */ 


}; 

根据 某 些 规则 ， 可 以 提供 一 个 可 选 的 hint 来 选择 地 址 。hint 是 一 个 用 于 过 滤 地 址 的 模板 ， 仪 
使 用 ai_family、ai_flags、ai_protocol 和 ai_socktype 字 有 段 。 剩余 的 整数 字段 必须 
设 为 零 ， 并 且 指 针 字 段 为 空 。 表 16-5 总 结 了 在 ai_Eflags 中 所 用 的 标志 ， 这 些 标志 用 来 指定 如 
何 处 理 地 址 和 名 字 。 


表 16-5 addrinfo 结 构 标 志 















AI ADDRCONFIG 
AI, ALL 
AI CANONNAME 


查询 配置 的 地 址 类 型 【IPv4 或 IPv6) 
查找 IPv4 和 IPv6 地 址 ( 仅 用 于 AI_V4MAPPED) 
需要 一 个 规范 名 (而 不 是 别名 ) 




















AI_NUMERICHOST 以 数字 格式 返回 主机 地 址 

AI_NUMERICSERV 以 端口 号 返回 服务 

AI_PASSIVE 套 接 字 地 址 用 于 监听 绑 定 

AI_V4MRPPED 如 果 没 有 找到 IPv6 地 址 ， 则 返回 映射 到 IPv6 格 式 的 IPv4 地 址 


如 果 getadqdrinfo 失 败 ， 不 能 使 用 perror 或 strerror 来 生成 错误 消息 。 替 代 地 ， 调 用 
gai_strerror 将 返回 的 错误 码 转 换 成 错误 消息 。 
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#include <netdb.h> 


const char *gai_strerror(int error); 





BEA: 指向 描述 错误 的 字符 串 的 指针 
函数 getnameinfo 将 地 址 转换 成 主机 名 或 者 服务 名 。 


#include <sys/socket .h> 
#include <netdb.h> 


int getnameinfo(const struct sockaddr *restrict addr, 
socklen_t alen, char *restrict host, 
socklen_t hostlen, char *restrict service, 
socklen_t servlen, unsigned int flags); 


返回 值 ， 若 成 功 则 返回 0， 若 出 错 则 返回 非 0 值 


套 接 字 地 址 (addr) 被 转换 成 主机 名 或 服务 名 。 如 果 pos 硅 f 空 ， 它 指向 一 个 长 度 为 hostien 字 节 
的 缓冲 区 用 于 存储 返回 的 主机 名 。 同 样 ， 如 果 service 非 空 ， 它 指向 一 个 长 度 为 servienr 字 节 的 组 
冲 区 用 于 存储 返回 的 服务 名 。 

参数 fass 指 定 一 些 转换 的 控制 方式 ， 表 16-6 总 结 了 系统 支持 的 标志 。 


表 16-6 getnameinfom MRE 





NI, DGRAM 服务 基于 数据 报 而 非 基 于 流 

NI_NAMEREQD 如 果 找 不 到 主机 名 字 ， 将 其 作为 一 个 错误 对 待 

NI. NOFQDN 对 于 本 地 主机 ， 仅 返回 完全 限定 域名 的 节点 名 字 部 分 
NI_NUMERICHOST 以 数字 形式 而 非 名 字 返 回 主机 地 址 
NI_NUMERICSERV 以 数字 形式 而 非 名 字 返 回 服务 地 址 ( 即 端口 号 ) 








程序 清单 16-1 说 明了 国 数 getaddrinfo 的 使 用 方法 。 
程序 清单 16-1 打印 主机 和 服务 信息 


#include "apue .hn 

#include «netdb.h» 

#include «arpa/inet.h» 

#if defined(BSD) || defined (MACOS) 
#include «sys/socket.h» 

#include «netinet/in.h» 

#endif 


void 
print_family(struct addrinfo *aip) 
{ 
printf(" family "); 
switch (aip-»ai family) ( 
case AF INET: 
printf ("inet"); 
break; 
case AF_INET6: 
printf ("inet6"); 
break; 
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case AF UNIX: 
printf ("unix"); 
break; 
case AF UNSPEC: 
printf ("unspecified"); 
break; 
default: 
printf ("unknown"); 
} 


} 


void 
print_type(struct addrinfo *aip) 


printf(" type "); 

switch (aip-»ai socktype) { 

case SOCK STREAM: 
printf ("stream"); 
break; 

case SOCK DGRAM: 
printf ("datagram") ; 
break; 

case SOCK_SEQPACKET: 
printf ("seqpacket") ; 
break; 

case SOCK_RAW: 
printf ("raw"); 


break; 
default: 
printf ("unknown ($d)", aip->ai_socktype) ; 
} 
} 
void 
print_protocol (struct addrinfo *aip) 
{ 


printf(" protocol "); 
switch (aip-»ai protocol) ( 
case 0: 
printf ("default"); 
break; 
case IPPROTO TCP: 
printf ("TCP"); 
break; 
case IPPROTO UDP: 
printf ("UDP") ; 
break; 
case IPPROTO_RAW: 
printf ("raw"); 
break; 
default: 
printf ("unknown (%d)", aip->ai_protocol) ; 
} 


} 


void 
print flags(struct addrinfo *aip) 
{ 
printf ("flags"); 
if (aip->ai_flags == 0) { 
printf(" 0"); 
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} else { 
if (aip-»ai flags & AI PASSIVE) 
printf(" passive"); 
if (aip-»ai flags & ÀI CANONNAME) 
printf(" canon"); 
if (aip-»ai flags & AI NUMERICHOST) 
printf(" numhost"); 
#if defined(AI NUMERICSERV) 
if (aip-»ai flags & AI NUMERICSERV) 
printf(" numserv"); 
#tendif 
#if defined (AI_V4MAPPED) 
if (aip->ai_flags & AI_V4MAPPED) 
printf (" v4mapped") ; 
#tendif 
#if defined (AI_ALL) 
if (aip-»ai flags & AI, ALL) 
printf(" all"); 


#endif 
} 
} 
int : 
main(int argc, char *argv[]) 
{ 
struct addrinfo *ailist, *aip; 
struct addrinfo hint; 
struct sockaddr in *sinp; 
const char *addr; 
int err; 
char abuf [INET_ADDRSTRLEN] ; 


if (argc != 3) 
err quit("usage: $s nodename service", argv[0]); 
hint.ai flags - AI CANONNAME; 
hint.ai family - 0; 
hint.ai socktype - 0; 
hint.ai protocol = 0; 
hint.ai addrlen = 0; 
hint.ai canonname = NULL; 
hint.ai addr = NULL; 
hint.ai next - NULL; 


if ((err = getaddrinfo(argv[1], argv[2], &hint, &ailist)) !- 0) 
err quit ("getaddrinfo error: ts", gai strerror(err)); 
for (aip = ailist; aip != NULL; aip = aip-»ai next) { 


print flags (aip); 
print family(aip); 
print type (aip); 
print protocól(aip); 
printf("\n\thost $s", aip-»ai canonname?aip-»ai canonname:"-"); 
if (aip-»ai family == AF INET) { 

sinp = (struct sockaddr in *)aip-»ai addr; 

addr - inet ntop(AF INET, &sinp-»sin addr, abuf, 

INET ADDRSTRLEN); 
printf(" address $s", addr?addr:"unknown"); 
printf(" port $d", ntohs(sinp-»sin port)); 


printf ("Mn"); 


) 


exit(0); 
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这 个 程序 说 明了 函数 getaddrinfo 的 使 用 方法 。 如 果 有 多 个 协议 为 指定 的 主机 提供 相应 
的 服务 ， 程 序 会 打印 出 超过 一 条 的 信息 。 本 例 中 ， 仅 仅 打印 工作 在 IPv4 (ai_family 为 
AF INET) 上 协议 的 地 址 信息 。 如 果 想 将 输出 限制 在 AF_INET 协 议 族 ， 可 以 在 hint 中 设置 
ai_family 字 7 段 。 

程序 在 某 个 测试 系统 上 运行 时 ， 得 到 了 如 下 输出 : 

$ ./a.out harry nfs 

flags canon family inet type stream protocol TCP 

host harry address 192.168.1.105 port 2049 


flags canon family inet type datagram protocol UDP 
host harry address 192.168.1.105 port 2049 


16.3.4 将 套 接 字 与 地 址 绑 定 


与 客户 端的 套 接 字 关 联 的 地 址 没有 太 大 意义 ， 可 以 让 系统 选 一 个 默认 的 地 址 。 然 而 ， 对 于 服 
务 器 ， 需 要 给 一 个 接收 客户 端 请 求 的 套 接 字 绑 定 一 个 众所周知 的 地 址 。 客 户 端 应 有 一 种 方法 来 发 
现 用 以 连接 服务 器 的 地 址 ， 最 简单 的 方法 就 是 为 服务 器 保留 一 个 地 址 并 且 在 /etc/services 或 
者 某 个 名 字 服 务 (name service) 中 注册 。 

可 以 用 bind 函 数 将 地 址 绑 定 到 一 个 套 接 字 。 


#include <sys/socket .h> 


int bind (int sockfd, const struct sockaddr ‘addr, socklen t len); 





返回 值 : 著 成功 则 返回 0， 若 出 错 则 返回 一 ! 


对 于 所 能 使 用 的 地 址 有 一 些 限制 

。 在 进程 所 运行 的 机 器 上 ， 指 定 的 地 址 必须 有 效 ， 不 能 指定 一 个 其 他 机 器 的 地 址 。 

© 地址 必须 和 创建 套 接 字 时 的 地 址 族 所 支持 的 格式 相 匹 配 。 

。 端 口号 必须 不 小 于 1024 ， 除 非 该 进程 具有 相应 的 特权 〈 即 为 超级 用 户 )。 

。 一 般 只 有 套 接 字 端 点 能 够 与 地 址 绑 定 ， 尽 管 有 些 协 议 允 许多 重 绑 定 。 

对 于 因特网 域 ， 如 果 指 定 IP 地 址 为 TLNADDR_ANY， 套 接 字 端 点 可 以 被 绑 定 到 所 有 的 系统 
网 络 接 口 。 这 意味 着 可 以 收 到 这 个 系统 所 安装 的 所 有 网 卡 的 数据 包 。 在 下 一 节 中 将 看 到 ， 如 
果 调 用 connect 或 1isten， 但 没有 绑 定 地 址 到 一 个 套 接 字 ， 系 统 会 选 一 个 地 址 并 将 其 绑 定 到 
套 接 字 。 

可 以 调用 函数 getsockname 来 发 现 绑 定 到 一 个 套 接 字 的 地 址 。 


#include <sys/socket.h> 


int getsockname (int sockfd, struct sockaddr *restrict addr, 
Socklen t *restrict alenp) ; 





返回 值 : 若 成 功 则 返回 0， 若 出 错 则 返回 -1 


调用 getsockname 之 前 ， 设 置 alenp 为 一 个 指向 整数 的 指针 ， 该 整数 指定 缓冲 区 sockaddr 的 
大 小 。 返 回 时 ， 该 整数 会 被 设置 成 返回 地 址 的 大 小 。 如 果 该 地 址 和 提供 的 缓冲 区 长 度 不 匹配 ， 
则 将 其 截断 而 不 报错 。 如 果 当 前 没有 绑 定 到 该 套 接 字 的 地 址 ， 其 结果 没有 定义 。 

如 果 套 接 字 已 经 和 对 方 连接 ， 调 用 getpeername 来 找到 对 方 的 地 址 。 
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#include <sys/socket .h> 


int getpeername(int sockfd, struct sockaddr *restrict addr, 


socklen_t *restrict alenp) ; 


返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 -1 





除了 还 会 返回 对 方 的 地 址 之 外 ， 函 数 getpeername 和 getsockname 一 样 。 


16.4 建立 连接 


如 果 处 理 的 是 面向 连接 的 网 络 服务 (SOCK_STREAM 或 SOCK_SEQPACKET)， 在 开始 交换 
数据 以 前 ， 需 要 在 请 求 服务 的 进程 套 接 字 (客户 端 ) 和 提供 服务 的 进程 套 接 字 (服务 器 ) dd 
建立 一 个 连接 。 可 以 用 connect 建 立 一 个 连接 。 


#include «sys/socket.h» 


int connect (int sockfd, const struct sockaddr *addr, socklen_t len); 


BAÉ: 若 成 功 则 返回 0， 若 出 错 则 返回 -1 





在 ccnnect 中 所 指定 的 地 址 是 想 与 之 通信 的 服务 器 地 址 。 如 果 sockfa 没 有 绑 定 到 一 个 地 址 ， 
connect 会 给 调用 者 绑 定 一 个 默认 地 址 。 

当 连 接 一 个 服务 器 时 ， 出 于 一 些 原因 ， 连 接 可 能 失败 。 要 连接 的 机 器 必须 开启 并 且 正 在 运 
行 ， 服务器 必须 绑 定 到 一 个 想 与 之 连接 的 地 址 ， 并 且 在 服务 器 的 等 待 连接 队列 中 应 有 足够 的 空 
间 (马上 将 学 到 这 一 点 )。 因 此 ， 应 用 程序 必须 能 够 处 理 connect 返 回 的 错误 ， 这 些 错 误 可 能 
由 一 些 瞬时 变化 条 件 引起 。 









程序 清单 16-2 显 示 了 一 种 如 何 处 理 瞬 时 ccnnect 错 误 的 方法 。 这 在 一 个 负载 很 重 的 服务 器 
上 很 有 可 能 发 生 。 


程序 清单 16-2 支持 重 试 的 连接 


#include "apue.h" 
#include «sys/socket.h» 


#define MAXSLEEP 128 


int 
connect_retry(int sockfd, const struct sockaddr *addr, socklen t alen) 


int nsec; 


/* 
* Try to connect with exponential backoff. 
*/ 
for (nsec - 1; nsec «- MAXSLEEP; nsec ««- 1) ( 
if (connect(sockfd, addr, alen) == 0) { 

/* 

* Connection accepted. 

二 天 oh 

return (0)-; gm t 


) 
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/* 
* Delay before trying again. 
x, 
if (nsec «- MAXSLEEP/2) 
sleep (nsec) ; 
} 


return(-1); 

} 

这 个 函数 使 用 了 名 为 指数 补偿 (exponential backoff) 的 算法 。 如 果 调 用 connect 失 败 ， 进 
程 就 休眠 一 小 段 时 间 然 后 再 尝试 ， 每 循环 一 次 增加 每 次 尝试 的 延迟 ， 直 到 最 大 延迟 为 2 分 钟 。 口 

如 果 套 接 字 描 述 符 处 于 将 要 在 16.8 节 讨论 的 非 阻塞 模式 下 ， 那 么 在 连接 不 能 马上 建立 时 ， 
connect 将 会 返回 -1， 并 且 将 errno 设 为 特殊 的 错误 码 EINPROGRESS。 应 用 程序 可 以 使 用 
pol1 或 者 select 来 判断 文件 描述 符 何 时 可 写 。 如 果 可 写 ， 连 接 完 成 。 

函数 conmnect 还 可 以 用 于 无 连接 的 网 络 服务 (SOcCK_DGRAM) 。 这 看 起 来 有 点 了 矛盾， 实际 
上 却 是 一 个 不 错 的 选择 。 如 果 在 SOCK_DGRAM 套 接 字 上 调用 connect， 所 有 发 送 报 文 的 目标 地 
址 设 为 connect 调 用 中 所 指定 的 地 址 ， 这 样 每 次 传送 报 文 时 就 不 需要 再 提供 地 址 。 另 外 ， 仅 能 
接收 来 自 指定 地 址 的 报 文 。 

服务 器 调用 1isten 来 宜 告 可 以 接受 连接 请 求 。 


#include <sys/socket.h> 





int listen(int sockfd, int backlog) ; 


返回 值 : 若 成 功 则 返回 0， 若 出 错 则 返回 -1 





参数 backlog 提 供 了 一 个 提示 ,用 于 表示 该 进程 所 要 入 队 的 连接 请 求 数量 。 其 实际 值 由 系统 决定 ， 
但 上 限 由 <sys /socket .h> 中 SOMAXCONN 指 定 。 


Solaris 系 统 忽 略 <sYs/socket.h> 中 的 SOMAXCONN 值 ， 具 体 的 上 限 依 赖 于 每 个 协议 的 实现 。 对 于 
TCP, XU 4i 99128, 


一 旦 队列 满 ， 系 统 会 拒绝 多 余 连 接 请 求 ， 所 以 backlog 的 值 应 该 基于 服务 器 期 望 负载 和 接受 
连接 请 求 与 启动 服务 的 处 理 能 力 来 选择 。 

一 旦 服务 器 调用 了 1isten， 套 接 字 就 能 接收 连接 请 求 。 使 用 函数 accept 获 得 连接 请 求 并 
建立 连接 。 


#include <sys/socket .h> 


int accept (int sockfd, struct sockaddr *restrict addr, 


socklen t *restrict len); 


返回 值 : ARAM (ERF) 描述 符 ， 若 出 错 则 返回 -1 


函数 accept 所 返回 的 文件 描述 符 是 套 接 字 描 述 符 ， 该 描述 符 连 接 到 调用 connect 的 客户 端 。 
这 个 新 的 套 接 字 描 述 符 和 原始 套 接 字 (sockfd) 具有 相同 的 套 接 字 类 型 和 地 址 族 。 传 给 accept 
的 原始 套 接 字 没 有 关联 到 这 个 连接 ， 而 是 继续 保持 可 用 状态 并 接受 其 他 连接 请 求 。 

如 果 不 关心 客户 端 标识 ， 可 以 将 参数 addr 和 jen 设 为 NULL， 否 则 ， 在 调用 accept 之 前 ， 应 
将 参数 addr 设 为 足够 大 的 缓冲 区 来 存放 地 址 ， 并 且 将 fen 设 为 指向 代表 这 个 缓冲 区 大 小 的 整数 的 
指针 。 返 回 时 ，accept 会 在 缓冲 区 填充 客户 端的 地 址 并 且 更 新 指针 ;en 所 指向 的 整数 为 该 地 址 
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的 大 小 。 
如 果 没 有 连接 请 求 等 待 处 理 ，accept 会 阻塞 直到 一 个 请 求 到 来 。 如 果 sockfd 处 于 非 阻塞 模 
式 ，accept 会 返回 -1 并 将 errno 设 置 为 EAGAIN 或 EWOULDBLOCK。 


本 文 所 讨论 的 所 有 平台 将 EAGAIN 定 义 为 与 EWOULDBLOCK 相 同 。 


如 果 服 务 器 调用 accept 并 且 当前 没有 连接 请 求 ， 服 务 器 会 阻塞 直到 一 个 请 求 到 来 。 另 外 ， 
服务 器 可 以 使 用 pol1 或 select 来 等 待 一 个 请 求 的 到 来 。 在 这 种 情况 下 ， 一 个 带 等 待 处 理 的 连 
接 请 求 套 接 字 会 以 可 读 的 方式 出 现 。 


程序 清单 16-3 显 示 了 一 个 服务 器 进程 用 以 分 配 和 初始 化 套 接 字 的 函数 。 
程序 清单 16-3 服务 器 初始 化 套 接 字 端点 


#include "apue.h" 
#include <errno.h> 
#include <sys/socket .h> 


int 
initserver(int type, const struct sockaddr *addr, socklen_t alen, 
int qlen) 


int fd; 
int err = 0; 


if ((fd - socket (addr-»sa family, type, 0)) « 0) 
return (-1); 

if (bind(fd, addr, alen) < 0) { 
err = errno; 
goto errout; 


if (type == SOCK_STREAM || type == SOCK_SEQPACKET) { 
if (listen(fd, qlen) < 0) { 
err = errno; 
goto errout; 


} 


return (fd) ; 


errout: 
Close (fd); 
errno = err; 
return(-1); 





我 们 将 会 看 到 ，TCP 关 于 地 址 复 用 有 一 些 奇怪 的 规则 ， 导 致 这 个 例子 并 不 完备 。 程 序 清 
单 16-9 显 示 了 有 关 这 个 函数 的 另 一 个 版 本 ， 该 版 本 可 以 绕 过 这 些 规则 ， 解 决 眼 下 版 本 的 主要 
缺陷 。 oO 


16.5 数据 传输 
既然 将 套 接 字 端 点 表示 为 文件 描述 符 ， 那 么 只 要 建立 连接 ， 就 可 以 使 用 read 和 write 来 
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通过 套 接 字 通 信 。 回 忆 前 面 所 讲 ， 通 过 在 connect 函 数 里 面 设置 对 方 地 址 ， 数 据 报 套 接 字 也 可 
以 “连接 ”"。 在 套 接 字 描 述 符 上 采用 readG 和 write 是 非常 有 意义 的 ， 因 为 可 以 传递 套 接 字 描 述 
符 到 那些 原先 设计 为 处 理 本 地 文件 的 函数 。 而 且 可 以 安排 传递 套 接 字 描 述 符 到 执行 程序 的 子 进 
程 ， 该 子 进程 并 不 了 解 套 接 字 。 

尽管 可 以 通过 read 和 write 交换 数据 ， 但 这 就 是 这 两 个 函数 所 能 做 的 一 切 。 如 果 想 指定 
选项 、 从 多 个 客户 端 接收 数据 包 或 者 发 送 带 外 数据 ， 需 要 采用 六 个 传递 数据 的 套 接 字 函数 中 的 
ewe 

三 个 函数 用 来 发 送 数据 ， 三 个 用 于 接受 数据 。 首 先 ， 考 查 用 于 发 送 数据 的 函数 。 

最 简单 的 是 senda， 它 和 write 很 像 ， 但 是 可 以 指定 标志 来 改变 处 理 传输 数据 的 方式 。 


#include «sys/socket.h» 


ssize t send(int sockfd, const void *buf, size t nbytes, int flags); 


返回 值 : 若 成 功 则 返回 发 送 的 字 节 数 ， 若 出 错 则 返回 -1 


类 似 write， 使 用 senq 时 套 接 字 必须 已 经 连接 。 参 数 pxjf 和 mbytes 与 write 中 的 含义 一 致 。 
然而 ， 与 write 不 同 的 是 ，send 支 持 第 四 个 参数 flags。 两 个 标志 是 Single UNIX 
Specification 规 定 的 ， 但 是 其 他 标志 通常 实现 也 支持 。 表 16-7 总 结 了 这 些 标志 。 


表 16-7 send 套 接 字 调用 标志 





MSG, DONTROUTE | 勿 将 数据 路 由 出 本 地 网 络 

MSG_DONTWAIT 允许 非 阻塞 操作 (等 价 于 使 用 0_NONBLOCK) 
MSG_EOR 如 果 协 议 支 持 ， 此 为 记录 结束 

MSG_OOB 如 果 协 议 支 持 ， 发 送 带 外 数据 (016.74) 


如 果 send 成 功 返 回 ， 并 不 必然 表示 连接 另 一 端的 进程 接收 数据 。 所 保证 的 仅 是 当 send 成 
功 返 回 时 ， 数 据 已 经 无 错误 地 发 送 到 网 络 上 。 

对 于 支持 为 报 文 设 限 的 协议 ， 如 果 单 个 报 文 超过 协议 所 支持 的 最 大 尺寸 ，send 失 败 并 将 
errno 设 为 EMSGSIZE， 对 于 字 节 流 协 议 ，send 会 阻塞 直到 整个 数据 被 传输 。 

函数 sendto 和 send 很 类 似 。 区 别 在 于 sendto 人 允许 在 无 连接 的 套 接 字 上 指定 一 个 目标 
地 址 。 





#include «sys/socket.h» 


ssize t sendto(int sockfd, const void *buf, size t nbytes, int flags, 


const struct sockaddr *destaddr, socklen t destlen) ; 


返回 值 : 若 成 功 则 返回 发 送 的 字 节 数 ， 若 出 错 则 返回 -1 





对 于 面向 连接 的 套 接 字 ， 目 标 地 址 是 忽略 的 ， 因 为 目标 地 址 蕴涵 在 连接 中 。 对 于 无 连接 的 套 接 
字 ， 不 能 使 用 send， 除 非 在 调用 connect 时 预先 设 定 了 目标 地 址 ， 或 者 采用 sendto 来 提供 另 
外 一 种 发 送 报 文 方式 。 

可 以 使 用 不 止 一 个 的 选择 来 通过 套 接 字 发 送 数 据 。 可 以 调用 带 有 msghdr 结 构 的 sendmsg 
来 指定 多 重 缓冲 区 传输 数据 ， 这 和 writev 很 相像 (14.7 节 )。 
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#include <sys/socket.h> 


ssize_t sendmsg(int sockfd, const struct msghdr *msg, int flags) ; 


返回 值 : 若 成 功 则 返回 发 送 的 宝 节 数 ， 若 出 错 则 返回 -1 





POSIX.1 定 义 了 msghdr 结 构 ， 它 至 少 应 该 有 如 下 成 员 ， 


struct meghdr { 


void *msg_name; /* optional address */ 

socklen_t msg_namelen; /* address size in bytes */ 
struct iovec  *msg iov; /* array of I/O buffers */ 

int msg iovlen; /* number of elements in array */ 
void *msg control; /* ancillary data */ 

Socklen t msg controllen; /* number of ancillary bytes */ 
int msg flags; /* flags for received message */ 


h l 
在 14.7 节 可 以 看 到 iovec 结 构 。 在 17.4.2 节 中 可 以 看 到 辅助 数据 的 使 用 。 
函数 recv 和 read 很 像 ， 但 是 允许 指定 选项 来 控制 如 何 按 收 数据 。 


#include <sys/socket.h> 


ssize_t recv(int sockfd, void *buf, size t nbytes, int flags) ; 


返回 值 :以 字 节 计数 的 消息 长 度 ， 若 无 可 用 消息 或 对 方 
已 经 按 序 结束 则 返回 9?， 若 出 错 则 返回 -1 





表 16-8 总 结 了 这 些 标志 。Single UNIX Specification 只 规定 了 三 个 标志 。 
表 16-8 recv 赛 接 字 调 用 标志 


mse ooB | | OOB | 如 果 协 议 支持 ， 接 收 带 外 数据 (6745) | 接收 带 外 数据 ( 见 16.7 节 ) 


MSG_PEEK 返回 报 文 内 容 而 不 真正 取 走 报 文 
MSG_TRUNC 即使 报 文 被 截断 ， 要 求 返回 的 是 报 文 的 实际 长 度 
MSG WAITALL | 等 待 直到 所 有 的 数据 可 用 ( 仅 SOCK_STREAM) 





当 指定 MSG_PEEK 标 志 时 ， 可 以 查看 下 一 个 要 读 的 数据 但 不 会 真正 取 走 。 当 再 次 调用 reada 
或 recv 函 数 时 会 返回 刚才 查看 的 数据 。 

对 于 SOCK_STREAM 套 接 字 ， 接 收 的 数据 可 以 比 请 求 的 少 。 标 志 MSG_WAITALL 阻 止 这 种 行 
为 ， 除 非 所 需 数据 全 部 收 到 ，recv 函 数 才 会 返回 。 对 于 SOCK_DGRAM 和 SOCK_SEQPACKET 套 
接 字 ，MSG_WAITALL 标 志 没 有 改变 什么 行为 ， 因 为 这 些 基于 报 文 的 套 接 字 类 型 一 次 读 取 就 返 
回 整 个 报 文 。 

如 果 发 送 者 已 经 调用 shutdown (16.245) 来 结束 传输 ， 或 者 网 络 协 议 支持 默认 的 顺序 关 
闭 并 且 发 送 端 已 经 关闭 ， 那 么 当 所 有 的 数据 接收 完毕 后 ，recv 返 回 0。 

如 果 有 兴趣 定位 发 送 者 ， 可 以 使 用 recvfrom 来 得 到 数据 发 送 者 的 源 地 址 。 
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#include <sys/socket .h> 


ssize t recvfrom(int sockfd, void *restrict buf, size_t len, int flags, 
struct sockaddr *restrict addr, 


socklen_t *restrict addrlen) ; 


返回 值 : 以 字 节 计数 的 消息 长 度 ， 若 无 可 用 消息 或 对 方 
已 经 按 序 结束 则 返回 0， 老 出 错 则 返回 -1 567 


如 果 addr 非 空 ， 它 将 包含 数据 发 送 者 的 套 接 字 端 点 地 址 。 当 调用 recvfrom 时 ， 需 要 设置 
addrlen 参 数 指向 一 个 包含 addr 所 指 的 套 接 字 缓冲 区 字 节 大 小 的 整数 。 返 回 时 ， 该 整数 设 为 该 地 
址 的 实际 字 节 大 小 。 

因为 可 以 获得 发 送 者 的 地 址 ，recvfrom 通 常用 于 无 连接 套 接 字 。 否 则 ，recvfrom 等 同 
于 recv。 

为 了 将 接收 到 的 数据 送 入 多 个 缓冲 区 (类 似 于 reaav (14.75)), 或 者 想 接收 辅助 数据 
(17.4.2 节 ) ， 可 以 使 用 recvmsg。 





#include «sys/socket.h» 


ssize_t recvmsg(int sockfd, struct msghdr *msg, int flags); 
返回 值 : 以 字 节 计数 的 消息 长 度 ， 若 无 可 用 消息 或 对 方 
已 经 按 序 结束 则 返回 9， 若 出 错 则 返回 一 1 
结构 msghar (在 sendmsg 中 见 过 ) 被 recvmsg 用 于 指定 接收 数据 的 输入 缓冲 区 。 可 以 设置 参 
数 flags 来 改变 recvmsg 的 默认 行为 。 返 回 时 ，msghar 结 构 中 的 msg_f1ags 字 段 被 设 为 所 接收 
数据 的 各 种 特征 (进入 recvmsg 时 msg_f1lags 被 忽略 )。 从 recvmsg 中 返回 的 各 种 可 能 值 总 
结 在 表 16-9 中 。 可 以 在 第 17 章 中 看 见 使 用 recvmsg 的 例子 。 


表 16-9 从 recvmsg 中 返回 的 msg_flags 标 志 





MSG_CTRUNC 控制 数据 被 截断 


MSG_DONTWAIT recvmsg 处 于 非 阻 塞 模式 
MSG_EOR 接收 到 记录 结束 符 
MSG_OOB 接收 到 带 外 数据 
MSG_TRUNC - 般 数 据 被 截断 





实例 : 面向 连接 的 客户 端 


程序 清单 16-4 显 示 了 一 个 客户 端 命令 ， 该 命令 用 于 与 服务 器 通信 以 获得 系统 命令 uptime 
的 输出 。 该 服务 称 为 “remote uptime” (简称 为 “ruptime” ) 。 


程序 清单 16-4 用 于 获取 服务 器 uptime 的 客户 端 命令 


#include "apue .hn 
#include <netdb.h> 
#include <errno.h> 
#include <sys/socket .h> 


#define MAXADDRLEN 256 


tA 


68 
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#define BUFLEN 128 
extern int connect retry(int, const struct Bockaddr *, socklen t); 


void 
print uptime(int sockfd) 
{ 

int n; 

char buf [BUFLEN] ; 


while ((n = recv(sockfd, buf, BUFLEN, 0)) > 0) 
write (STDOUT FILENO, buf, n); 

if (n « 0) 
err sys("recv error"); 


) 


int 

main(int argc, char *argv[]) 
struct addrinfo *ailist, *aip; 
struct addrinfo hint; 
int sockfd, err; 


if (argc != 2) 
err quit("usage: ruptime hostname"); 
hint.ai flags = 0; 
hint.ai family = 0; 
hint.ai socktype - 
hint.ai protocol - 
hint.ai addrlen - 0; 
hint.ai canonname - NULL; 
hint.ai addr - NULL; 
hint.ai next - NULL; 
if ((err = getaddrinfo(argv[1], "ruptime", &hint, &ailist)) != 0) 
err quit("getaddrinfo error: $s", gai strerror(err)); 
for (aip = ailist; aip != NULL; aip = aip-»ai next) { 
if ((sockfd = socket(aip-»ai family, SOCK STREAM, 0)) « 0) 
err - errno; 
if (connect retry(sockfd, aip-»ai addr, aip-»ai addrlen) « 0) { 
err - errno; 
) eise ( 
print uptime (Sockfd); 
exit (0); 


OCK_STREAM; 


了 了 


S 
0 


} 
} 
fprintf(stderr, "can’t connect to $8: %s\n", argv[i], 


strerror(err)); 
exit (1); 





这 个 程序 连接 服务 器 ， 读 取 服 务 器 发 送 过 来 的 字符 串 并 将 其 打印 到 标准 输出 。 既 然 使 用 
SOCK_STREAM 套 接 字 ， 就 不 能 保证 在 一 次 zecv 调 用 中 会 读 取 整 个 字符 串 ， 所 以 需要 重复 调用 
直到 返回 0。 

如 果 服 务 器 支持 多 重 网 络 接 口 或 多 重 网 络 协议 ， 函 数 getadarinfo 会 返回 不 止 一 个 候选 
地 址 。 轮 流 尝 试 每 个 地 址 ， 当 找到 一 个 允许 连接 到 服务 的 地 址 时 便 可 停止 。 使 用 程序 清单 16-2 
中 connect_retry 函 数 来 与 服务 器 建立 连接 。 口 
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#include 
#include 
#include 
#include 
#include 
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16-5 显 示 服 务 器 程序 ， 用 来 提供 uptime 命 令 到 程序 清单 16-4 的 客户 端 程序 的 输出 。 
程序 清单 16-5 提供 系统 uptime 的 服务 器 程序 





"apue.h" 
«netdb.h» 
«errno.h» 
«syslog.h» 
<sys/socket .h» 


#define BUFLEN 128 
#define QLEN 10 


#ifmdef HOST NAME MAX 
#define HOST NAME MAX 256 


#endif 


extern int initserver(int, struct sockaddr *, socklen t, int); 


void 


serve (int sockfd) 


{ 


int 


FILE 
char 


for 


} 


int 


clfd; 
*fp; 
buf [BUFLEN] ; 


(rent 

clfd = accept (sockfd, NULL, NULL); 

if (clfd < 0) { 
Syslog(LOG ERR, "ruptimed: accept error: %s", 

strerror (errno) ) ; 

exit (1); 

) 

if ((fp - popen("/usr/bin/uptime", "r")) -- NULL) ( 
sprintf (buf, "error: ts\n", strerror(errno)); 
send(clfd, buf, strlen(buf), 0); 

) eise ( 
while (fgets(buf, BUFLEN, fp) !- NULL) 

send(clfd, buf, strlen(buf), 0); 

pclose (fp); 


close(clfd); 


main(int argc, char *argv[]) 


{ 


struct addrinfo *ailist, *aip; 
struct addrinfo hint; 


int 


sockfd, err, n; 


char *host; 


if (argc !- 1) 


err quit("usage: ruptimed"); 


#ifdef SC HOST NAME MAX 


n = 


Sysconf( SC HOST NAME MAX); 


if (n < 0) /* best guess */ 


#endif 
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n = HOST_NAME MAX; 
host = malloc(n); 
if (host == NULL) 
err_sys("malloc error"); 
if (gethostname (host, n) < 0) 
err SyS("gethostname error"); 
daemonize ("ruptimed") ; 
hint.ai flags = AI CANONNAME; 
hint.ai family - 0; 
hint.ai socktype - SOCK STREAM; 
hint.ai protocol - 0; 
hint.ai addrlen - 0; 
hint.ai canonname - NULL; 
hint.ai addr - NULL; 
hint.ai next - NULL; 
if ((err - getaddrinfo(host, "ruptime", &hint, &ailist)) != 0) { 
syslog(LOG_ERR, "ruptimed: getaddrinfo error: ts", 
gai strerror(err)); 
exit (1); 
) 
for (aip - ailist; aip !- NULL; aip = aip-»ai next) { 
if ((sockfd = initserver(SOCK STREAM, aip-»ai addr, 
aip-»ai addrlen, QLEN)) »- 0) ( 
serve (sockfd) ; 
exit (0); 


) 
exit(1); 
e C REPRE IER ee 
为 了 找到 地 址 ， 服 务 器 程序 需要 获得 其 运行 时 的 主机 名 字 。 一 些 系统 不 定义 _sc_Hosm _ 
NAME_MAX 常 量 ， 因 此 这 种 情况 下 使 用 HOST_NAME_MAX。 如 果 系 统 不 定义 HOST_NAME_MAX， 
就 自己 定义 。POSIX.1 规 定 该 值 的 最 小 值 ' 为 255 字 节 ， 不 包括 终结 符 ， 因 此 定义 HOST_NAME_MAX 
为 256 以 包括 终结 符 。 
通过 调用 gethostname， 服 务 器 程序 获得 主机 名 字 ， 并 查看 远程 uptime 服 务 地 址 。 可 能 
会 有 多 个 地 址 返回 ， 但 简单 地 选择 第 一 个 来 建立 被 动 套 接 字 端 点 。 处 理 多 个 地 址 作为 练习 留 给 
读者 。 
使 用 程序 清单 16-3 的 ijni tserver 函 数 来 初始 化 套 接 字 端 点 ， 在 这 个 端点 等 待 到 来 的 连接 
请 求 。( 实 际 上 ， 使 用 的 是 程序 清单 16-9 的 版 本 ， 当 在 16.6 节 中 讨论 套 接 字 选项 时 ， 可 以 了 解 其 
中 的 原因 。) oO 


实例 ， 另 一 个 面向 连接 的 服务 器 


前 面 说 过 采用 文件 描述 符 来 访问 套 接 字 是 非常 有 意义 的 ， 因 为 允许 程序 对 联网 环境 的 网 络 
访问 一 无 所 知 。 程 序 清单 16-6 中 显示 的 服务 器 程序 版 本 显示 了 这 一 点 。 为 了 代替 从 uptime 命 
令 中 读 取 输 出 并 发 送 到 客户 端 ， 服 务 器 安排 upt ime 命 令 的 标准 输出 和 标准 错误 替换 为 连接 到 
客户 端的 套 接 字 端 点 。 


I. POSIX 要 求 主 机 名 长 度 不 小 于 _POSIX_HOST_NAME_MAX (该 值 不 包括 终结 符 为 255， 参见 本 书 2.5 节 说 
明 )。 一 一 译 者 注 


bbs.theithome.com 





#include 
#include 
#include 
#include 
#include 
#include 
#include 





165 数据 传输 


程序 清单 16-6 用 于 显示 命令 直接 写 到 套 接 字 的 服务 器 程序 


"apue.h" 
«netdb.h» 
«errno.h» 
<syslog.h> 
<fentl.h> 
<sys/socket .h> 
<sys/wait .h> 


#define QLEN 10 


#ifndef HOST NAME MAX 
#define HOST NAME MAX 256 


#endif 


extern int initserver(int, struct sockaddr *, socklen_t, int); 


void 


serve (int sockfd) 


{ 


int clfd, status; 
pid_t pid; 
for (;;) { 
clfd = accept (sockfd, NULL, NULL); 
if (clfd < 0) { 
syslog(LOG_ERR, "ruptimed: accept error: ts", 
strerror (errno) ) ; 
exit (1); 
} 
if ((pid = fork()) < 0) { 
Syslog(LOG ERR, "ruptimed: fork error: $s", 
strerror(errno)); 
exit(1); 
] else if (pid == 0) ( /* child */ 
/* 
* The parent called daemonize (Figure 13.1), so 
* STDIN FILENO, STDOUT FILENO, and STDERR FILENO 
* are already open to /dev/null. Thus, the call to 
* close doesn't need to be protected by checks that 
* clfd isn't already equal to one of these values. 
* 
/ 
if (dup2(clfd, STDOUT FILENO) !- STDOUT FILENO || 
dup2(clfd, STDERR FILENO) != STDERR FILENO) { 
syslog (LOG ERR, "ruptimed: unexpected error"); 
exit(1); 
} 
close (clfd); 
execl("/usr/bin/uptime", "uptime", (char *)0); 
syslog (LOG_ERR, "ruptimed: unexpected return from exec: 
Strerror(errno)); 
} eise ( /* parent */ 
close(clfd); 
waitpid(pid, &status, 0); 
) 
) 
} 
int 


main(int argc, char *argv[]}) 


{ 
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Struct addrinfo *ailist, *aip; 
Struct addrinfo hint; 
int Sockfd, err, n; 
char *host; 


if (argc !- 1) 
err quit("usage: ruptimed"); 
#ifdef SC HOST NAME MAX 
n = gysConf( SC HOST NAME MAX); 
if (n < 0) /* best guess */ 
#endif 
n = HOST NAME MAX; 
host = malloc(n); 
if (host == NULL) 
err Sys("malloc error"); 
if (gethostname(host, n) « 0) 
err_sys("gethostname error"); 
daemonize ("ruptimed"); 
hint.ai flags - AI CANONNAME; 
hint.ai family = 0; 
hint.ai_socktype = SOCK STREAM; 
hint.ai protocol - 0; 
hint.ai addrlen = 0; 
hint.ai canonname - NULL; 
hint.ai addr - NULL; 
hint.ai next - NULL; 
if ((err = getaddrinfo(host, "ruptime", &hint, &ailist)) != 0) { 
Syslog(LOG ERR, "ruptimed: getaddrinfo error: $s", 
gai strerror(err)); 
exit (1); 
} 
for (aip = ailist; aip != NULL; aip = aip->ai_next) { 
if ((sockfd = initserver(SOCK STREAM, aip-»ai addr, 
aip-»ai addrlen, QLEN)) >= 0) { 
serve (sockfd) ; 
exit (0); 
} 
} 
exit (1); 


} 


以 前 的 方式 是 采用 popen 来 运行 uptime 命 令 ， 并 从 连接 到 命令 标准 输出 的 管道 读 取 输 出 ， 
现在 采用 fork 来 创建 一 个 子 进程 ， 并 使 用 dup2 使 子 进程 的 STDIN_FILENO 的 副本 打开 到 
/dev/null、STDOUT_FILENO 和 STDERR_FILENO 打 开 到 套 接 字 端点 。 当 执行 uptime 上 肝 ， 
命令 将 结果 写 到 标准 输出 ， 该 标准 输出 连 到 套 接 字 ， 所 以 数据 被 送 到 ruptime 客 户 端 命令 。 

父 进程 可 以 安全 地 关闭 连接 到 客户 端的 文件 描述 符 ， 因 为 子 进程 仍旧 打开 着 。 父 进程 等 待 
子 进程 处 理 完毕 ， 所 以 子 进程 不 会 变 成 僵 死 进程 。 既 然 运行 uptime 花 费时 间 不 会 太 长 ， 父 进 
程 在 接受 下 一 个 连接 请 求 之 前 ， 可 以 等 待 子 进程 退出 。 不 过 ， 这 种 策略 不 适合 子 进程 运行 时 间 
比较 长 的 情况 。 口 

前 面 的 例子 采用 面向 连接 的 套 接 字 。 但 如 何 选择 合适 的 套 接 字 类 型 ? 何 时 采用 面向 连接 的 
套 接 字 ， 何 时 采用 无 连接 的 套 接 字 昵 ? 答案 取决 于 要 做 的 工作 以 及 对 错误 的 容忍 程度 。 

对 于 无 连接 套 接 字 ， 数 据 包 的 到 来 可 能 已 经 没有 次 序 ， 因 此 当 所 有 的 数据 不 能 放 在 一 个 包 
里 时 ， 在 应 用 程序 里 面 必须 关心 包 的 次 序 。 包 的 最 大 尺寸 是 通信 协议 的 特性 。 并 且 对 于 无 连接 


套 接 字 ， 包 可 能 丢失 。 如 果 应 用 程序 不 能 容忍 这 种 丢失 ， 必 须 使 用 面向 连接 的 套 接 字 。 
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容忍 包 丢 失意 味 着 两 个 选择 。 如 果 想 和 对 方 可 靠 通信 ， 必 须 对 数据 包 编 导 ， 如 果 发 现 包 丢 
失 ， 则 要 求 对 方 重新 传输 。 既 然 包 可 能 因 延 迟 而 疑似 丢失 ， 我 们 要 求 重 传 ， 但 该 包 却 又 出 现 ， 
与 重 传 过 来 的 包 重 复 。 因 此 必须 识别 重复 包 ， 如 果 出 现 重 复 包 ， 则 将 其 丢弃 。 

另外 一 个 选择 是 通过 让 用 户 再 次 尝试 命令 来 处 理 错 误 。 对 于 简单 的 应 用 程序 ， 这 就 足够 ， 
但 对 于 复杂 的 应 用 程序 ， 这 种 处 理 方式 通常 不 是 可 行 的 选择 ， 一 般 在 这 种 情况 下 使 用 面向 连接 
的 套 接 字 更 为 可 取 。 

面向 连接 的 套 接 字 的 缺陷 在 于 需要 更 多 的 时 间 和 工作 来 建立 一 个 连接 ， 并 且 每 个 连接 需要 
从 操作 系统 中 消耗 更 多 的 资源 。 


实例 : WERE AY 
程序 清单 16-7 中 的 程序 是 采用 数据 报 套 接 字 接口 的 uptime 客 户 端 命令 版 本 。 
程序 清单 16-7 采用 数据 报 服务 的 客户 端 命令 


#include "apue.h" 
#include <netdb.h> 
#include <errno.h> 
#include <sys/socket.h> 


#define BUFLEN 128 
#define TIMEOUT 20 
void 


sigalrm(int signo) 


} 


void 
print_uptime(int sockfd, struct addrinfo *aip) 


int n; 
char buf [BUFLEN] ; 


buf[0] = 0; 
if (sendto(sockfd, buf, 1, 0, aip-»ai addr, aip-»ai addrlen) « 0) 
err_sys("sendto error"); 
alarm(TIMEOUT); 
if ((n = recvfrom(sockfd, buf, BUFLEN, 0, NULL, NULL)) < 0) { 
if (errno != EINTR) 
alarm(0); 
err sys("recv error"); 


alarm(0); 

write(STDOUT FILENO, buf, n); 
} 
int 
main(int argc, char *argv[]) 


{ 


struct addrinfo *ailist, *aip; 
struct addrinfo hint; 

int sockfd, err; 
struct sigaction sa; 

if (argc != 2) 


err quit("usage: ruptime hostname"); 
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sa.sa_handler = sigalrm; 

8a.8a flags = 0; 

sigemptyset (&sa.sa_mask) ; 

if (sigaction(SIGALRM, &sa, NULL) < 0) 
err sys("sigaction error"); 

hint.ai flags = 0; 

hint.ai family - 0; 

hint.ai socktype = SOCK DGRAM; 

hint.ai protocol 0; 

hint.ai addrlen - 0; 

hint.ai canonname - NULL; 

hint.ai addr - NULL; 

hint.ai next - NULL; 

if ((err = getaddrinfo(argv[1], "ruptime", &hint, &ailist)) != 0) 
err quit("getaddrinfo error: $8", gai strerror(err)); 


for (aip = ailist; aip !- NULL; aip = aip-»ai next) { 
if ((sockfd = socket(aip-»ai family, SOCK DGRAM, 0)) < 0) { 
err - errno; 
) else { 
print uptime (sockfd, aip); 
exit(0); 
} 
} 


fprintf(stderr, "can't contact $8: %s\n", argv[1], strerror(err)); 
exit (1); 


) 


> RE eee 
除了 为 SIGALRM 增 加 一 个 信号 处 理 程序 以 外 ， 基 于 数据 报 的 客户 端 main 函 数 和 面向 连接 


的 客户 端 中 的 类 似 。 使 用 alarm 函 数 来 避免 调用 recvfrom 时 无 限期 阻塞 。 

对 于 面向 连接 的 协议 ， 需 要 在 交换 数据 前 连接 服务 器 。 对 于 服务 器 来 说 ， 到 来 的 连接 请 求 
已 经 足够 判断 出 所 需 提供 给 客户 端的 服务 。 但 是 对 于 基于 数据 报 的 协议 ， 需 要 有 一 种 方法 来 通 
知 服务 器 需要 它 提供 服务 。 本 例 中 ， 只 是 简单 地 给 服务 器 发 送 1 字 节 的 消息 。 服 务 器 接收 后 从 
包 中 得 到 地 址 ， 并 使 用 这 个 地 址 来 发 送 响应 消息 。 如 果 服 务 器 提供 多 个 服务 ， 可 以 使 用 这 个 请 
求 消息 来 指示 所 需要 的 服务 ,但 既然 服务 器 只 做 一 件 事情 ，1 字 节 消 息 的 内 容 是 无 关 紧 要 的 。 

如 采 服 务 器 不 在 运行 状态 ， 客 户 端 调用 recvfrom 便 会 无 限期 阻塞 。 对 于 面向 连接 的 例子 ， 
如 采 服 务 器 不 运行 ，connect 调 用 会 失败 。 为 了 避免 无 限期 阻塞 ， 调 用 recvfrom 之 前 设置 警 
告 时 钟 。 回 


SEDI. 无 连接 服务 器 
程序 清单 16-8 中 的 程序 是 数据 报 版 本 的 uptime 服 务 器 程序 。 
程序 清单 16-8 基于 数据 报 提供 系统 uptime 的 服务 器 程序 


#include "apue .hn 
#include «netdb.h» 
#include «errno.h» 
#include «syslog.h» 
#include <sys/socket .h> 


#define BUFLEN 128 
#define MAXADDRLEN 256 
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#ifndef HOST_NAME_MAX 
&define HOST NAME MAX 256 
#endif 


extern int initserver(int, struct sockaddr *, socklen_t, int); 


void 
serve (int sockfd) 


{ 


} 


int 


int n; 

socklen t alen; 

FILE *fp; 

char buf [BUFLEN] ; 
char abuf [MAXADDRLEN] ; 
for (;;) { 


alen = MAXADDRLEN; 
if ((n = recvfrom(sockfd, buf, BUFLEN, 0, 
(struct sockaddr *)abuf, &alen)) < 0) { 
syslog(LOG_ERR, "ruptimed: recvfrom error: £s", 
Strerror(errno)); 
exit (1); 
} 
if ((fp = popen("/usr/bin/uptime", "r")) == NULL) { 
sprintf (buf, "error: ts\n", strerror(errno)); 
sendto(sockfd, buf, strlen(buf), 0, 
(struct sockaddr *)abuf, alen); 
} else { 
if (fgets(buf, BUFLEN, fp) != NULL) 
sendto(sockfd, buf, strlen(buf), 0, 


(struct sockaddr *)abuf, alen); 
pelose (fp); 


main(int argc, char *argv[]) 


{ 


struct addrinfo *ailist, *aip; 
struct addrinfo hint; 

int Sockfd, err, n; 
char *host; 


if (argc != 1) 
err quit("usage: ruptimed"); 


#ifdef SC HOST NAME MAX 


n - Sysconf( SC HOST NAME MAX); 
if (n« 0) /* best guess */ 


#endif 


n = HOST NAME MAX; 
host = malloc(n); 
if (host == NULL) 
err_sys("malloc error"); 
if (gethostname(host, n) < 0) 
err_sys("gethostname error"); 
daemonize("ruptimed"); 
hint.ai flags - AI CANONNAME; 
hint.ai family - 0; 
hint.ai socktype - SOCK DGRAM; 
hint.ai protocol - 0; 
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hint.ai_addrlen = 0; 
hint.ai_canonname = NULL; 
hint.ai_addr = NULL; 
hint.ai next = NULL; 
if ((err = getaddrinfo(host, "ruptime", &hint, &ailist)) != 0) { 
Syslog(LOG ERR, "ruptimed: getaddrinfo error: ts", 
gai strerror(err)); 
exit(1); 
) 
for (aip = ailist; aip !- NULL; aip = aip-»ai next) { 
if ((sockfd = initserver(SOCK DGRAM, aip->ai_addr, 
aip-»ai addrlen, 0)) >= 0) { 
serve (sockfd) ; 
exit (0); 
} 
} 


exit(1); 


} 


服务 器 程序 在 recvfrom 中 阻塞 等 待 服务 请 求 。 当 一 个 请 求 到 达 时 ， 保 存 请 求 者 地 址 并 使 
用 popen 来 运行 uptime 命 令 。 采 用 sendto 函 数 将 输出 发 送 到 客户 端 ， 其 目标 地 址 就 设 为 刚才 
的 请 求 者 地 址 。 a 


16.6 套 接 字 选 项 


套 接 字 机 制 提 供 两 个 套 接 字 选项 接口 来 控制 套 接 字 行 为 。 一 个 接口 用 来 设置 选项 ， 另 一 个 
接口 允许 查询 一 个 选项 的 状态 。 可 以 获取 或 设置 三 种 选项 ;: 

(1) 通用 选项 ， 工 作 在 所 有 套 接 字 类 型 上 。 

(2) 在 套 接 字 有 层次 管理 的 选项 ， 但 是 依赖 于 下 层 协 议 的 支持 。 

(3) 特定 于 某 协 议 的 选项 ， 为 每 个 协议 所 独 有 。 

Single UNIX Specification 仅 定义 了 套 接 字 有 层 的 选项 (上述 三 种 选项 中 的 前 两 种 选项 )。 

可 以 采用 setsockopt 函 数 来 设置 套 接 宇 选项 。 


#include <sys/socket.h> 


int setsockopt (int sockfd, int level, int option, const void *val, 


Socklen t len); 


返回 值 : 车 成 功 则 返回 0， 车 出 错 则 返回 一 1 





参数 level 标 识 了 选项 应 用 的 协议 。 如 果 选 项 是 通用 的 套 接 字 层 选项 ，level 设 置 成 SOL_SOCKET。 
否则 ，level 设 置 成 控制 这 个 选项 的 协议 号 。 例 如 ， 对 于 TCP 选 项 ， 这 是 IPPROTO_TCP， 对 于 IP 
选项 ， 这 是 IPPROTO_IP。 表 16-10 总 结 了 Single UNIX Specification 所 定义 的 通用 套 接 字 层 的 
选项 。 

参数 val 根 据 选 项 的 不 同 指向 一 个 数据 结构 或 者 一 个 整数 。 一 些 选 项 是 on/off 开 关 。 如 果 整 
数 非 零 ， 那 么 选项 被 启用 。 如 果 整 数 为 零 ， 那 么 该 选项 被 禁止 。 参 数 len 指 定 了 val 指 向 的 对 象 
的 大 小 。 

可 以 使 用 getsockopt 函 数 来 发 现 选项 的 当前 值 。 
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#include <sys/socket .h> 


int getsockopt (int sockfd, int level, int option, void *restrict val, 


Socklen t *restrict lenp); 





返回 值 : 阁 成 功 则 返回 0， 若 出 错 则 返回 -1 


表 {16-10 套 接 字 选项 


SO_ACCEPTCONN i 返回 信息 指示 该 套 接 字 是 否 能 监听 (Mgetsockopt) 
$0, BROADCAST j 如 果 *val 非 零 ， 广 播 数据 包 

SO_DEBUG i 如 果 *val 非 零 ， 启 用 网 络 驱动 调试 功能 

SO DONTROUTE i 如 果 *val 非 零 ， 绕 过 通常 路 由 

SO_ERROR i 返回 挂 起 的 套 接 字 错误 并 清除 ( 仪 getsockopt) 
$O_KEEPALIVE i 如 果 *val 非 零 ， 启 用 周期 性 keep-alive 消 息 
SO_LINGER 当 有 未 发 消息 并 且 套 接 字 关闭 时 ， 延 迟 时 间 
SO_OOBINLINE j 如 果 *val 非 零 ， 将 带 外 数据 放 在 普通 数据 中 
SO_RCVBUF i 以 字 节 为 单位 的 接收 缓冲 区 大 小 

SO_RCVLOWAT int 接收 调用 中 返回 的 以 字 节 为 单位 的 最 小 数据 量 
SO_RCVTIMEO 套 接 字 接 收 调用 的 超时 值 

SO, REUSEADDR i 如 果 *val 非 零 ， 重 用 bind 中 的 地 址 
SO_SNDBUF i 以 字 节 为 单位 的 发 送 缓冲 区 大 小 

SO_SNDLOWAT i 发 送 调 用 中 以 字 节 为 单位 的 发 送 的 最 小 数据 量 
SO_SNDTIMEO struct timeval 套 接 字 发 送 调用 的 超时 值 

SO_TYPE int 标识 套 接 字 类 型 ( 仪 getsockopt) 


注意 到 参数 lenp 是 一 个 指向 整数 的 指针 。 在 调用 getsockopt 之 前 ， 设 置 该 整数 为 复制 选 
项 缓冲 区 的 大 小 。 如 果实 际 的 尺寸 大 于 此 值 ， 选 项 会 被 截断 而 不 报错 ， 如 果实 际 尺寸 正好 等 于 
或 者 小 于 此 值 ， 那 么 返回 时 将 此 值 更 新 为 实际 尺寸 。 




















当 服 务 器 终止 并 尝试 立即 重启 时 ， 程 序 清单 16-3 中 的 函数 不 会 正常 工作 。 除 非 超 时 (这 个 
通常 约 为 几 分 钟 )， 通常 TCP 的 实现 不 允许 绑 定 同一 个 地 址 。 幸 运 的 是 套 接 字 选项 
SO_REUSEADDR 人 允许 越过 这 个 限制 ， 如 程序 清单 16-9 所 示 。 


程序 清单 16-9 采用 地 址 复 用 初始 化 套 接 字 端 点 


#include "apue.h" 
#include <errno.h> 
#include <sys/socket .h> 
int 
initserver(int type, const struct sockaddr *addr, socklen_t alen, 
int qlen) 
{ 
int fd, err; 
int reuse = 1; 


if ((fd = socket (addr->sa_family, type, 0)) « 0) 
return (-1) ; 
if (setsockopt (fd, SOL SOCKET, SO REUSEADDR, &reuse, 
sizeof(int)) < 0) { 
err = errno; 
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goto errout; 


if (bind(fd, addr, alen) < 0) { 
err = errno; 
goto errout; 


if (type == SOCK STREAM || type == SOCK SEQPACKET) { 
if (listen(fd, glen) < 0) { 
err = errno; 
goto errout; 


} 


return (fd); 


errout: 
close (fd); 
errno = err; 
return(-1); 





为 了 启用 SO_REUSEADDR 选 项 ， 在 setsockopt 中 val 的 参数 设置 为 一 个 非 零 整数 的 地 址 。 
设置 len 参 数 为 val 所 指 的 对 象 的 大 小 。 口 


16.7 带 外 数据 


带 外 数据 (Out-of-band data) 是 一 些 通 信 协 议 所 支持 的 可 选 特征 ， 人 允许 更 高 优先 级 的 数据 
比 普通 数据 优先 传输 。 即 使 传输 队列 已 经 有 数据 ， 带 外 数据 先行 传输 。TCP 支 持 带 外 数据 ， 但 
是 UDP 不 支持 。 套 接 字 接口 对 带 外 数据 的 支持 ， 很 大 程度 受 TCP 带 外 数据 具体 实现 的 影响 。 

TCP 将 带 外 数据 称 为 “紧急 ”数据 (“urgent”data) 。TCP 仅 支持 一 个 字 节 的 紧急 数据 ， 但 
是 允许 紧急 数据 在 普通 数据 传递 机 制 数据 流 之 外 传输 。 为 了 产生 紧急 数据 ， 在 三 个 send 函 数 
中 任何 一 个 指定 标志 MSG_OOB。 如 果 带 MSG_ooB 标 志 传 输 字 节 超 过 一 个 时 ， 最 后 一 个 字 节 被 
看 作 紧急 数据 字 节 。 

如 果 安 排 发 生 套 接 字 信号 ， 当 接收 到 紧急 数据 时 ， 那 么 发 送信 号 SIGURG。 在 3.14 节 和 
14.6.2 节 中 ， 可 以 看 到 在 fcnt1 中 使 用 F_SETOWN 命 令 来 设置 一 个 套 接 字 的 所 有 权 。 如 果 
fcnt1 中 第 三 个 参数 为 正 值 ， 那 么 指定 了 进程 ID ， 如 果 为 非 -1 的 负 值 ， 那 么 代表 了 进程 组 ID。 
因此 ， 通 过 调用 以 下 函数 ， 可 以 安排 进程 接收 一 个 套 接 字 的 信号 。 

fentl(sockfd, F SETOWN, pid); 

F_GETOWN 命 令 可 以 用 来 获得 当前 套 接 字 所 有 权 。 对 于 F_SETOWN 命 令 ， 一 个 负 值 代表 一 
个 进程 组 一 ， 一 个 正 值 代表 进程 下 。 因 此 ， 调 用 

owner = fentl(sockfd, F GETOWN, 0); 
返回 值 owvner ， 如 果 ownez 为 正 值 ， 则 ownez 等 于 配置 为 接受 套 接 字 信 号 的 进程 ID ， 如 果 
ownez 为 负 值 ， 则 其 绝对 值 为 接受 套 接 字 信 号 的 进程 组 ID。 

TCP 支 持 紧 急 标 记 (urgent mark) 的 概念 : 在 普通 数据 流 中 紧急 数据 所 在 的 位 置 。 如 果 采 
用 套 接 字 选项 So_ooBINLITNE， 那 么 可 以 在 普通 数据 中 接收 紧急 数据 。 为 帮助 判断 是 否 接收 到 
紧急 标记 ， 可 以 使 用 函数 sockatmark。 
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#include «sys/socket.h» 


int sockatmark (int sockfd) ; 


返回 值 ， 若 在 标记 处 则 返回 1， 若 没有 在 标记 处 则 返回 9， 若 出 错 则 返回 -1 





当下 一 个 要 读 的 字 节 在 紧急 标志 所 标识 的 位 置 时 ，sockatmark 返 回 1。 

当 带 外 数据 出 现在 套 接 字 读 取 队 列 时 ，select 函 数 (14.5.1 节 ) 会 返回 一 个 文件 描述 符 并 
县 拥有 一 个 异常 状态 挂 起 。 可 以 在 普通 数据 流 上 接受 紧急 数据 ， 或 者 在 某 个 recv 函 数 中 采用 
MSG_OOB 标 志 在 其 他 队列 数据 之 前 接收 紧急 数据 。TCP 队 列 仅 有 一 字 节 的 紧急 数据 ， 如 果 在 接 
收 当 前 的 紧急 数据 字 节 之 前 又 有 新 的 紧急 数据 到 来 ， 那 么 当前 的 字 节 会 被 丢弃 。 


16.8 非 阻塞 和 异步 VO 


通常 ，recv 函 数 设 有 数据 可 用 时 会 阻塞 等 待 。 同 样 地 ， 当 套 接 字 输 出 队列 没有 足够 空间 
来 发 送 销 息 时 函数 sena 会 阻塞 。 在 套 接 字 非 阻塞 模式 下 ， 行 为 会 改变 。 在 这 种 情况 下 ， 这 些 
函数 不 会 阻塞 而 是 失败 ， 设 置 errno 为 EWOULDBLOCK 或 者 EAGAIN。 当 这 些 发 生 时 ， 可 以 使 用 
poll 或 select 来 判断 何 时 能 接收 或 者 传输 数据 。 

在 Single UNIX Specification 中 ， 其 实时 扩展 包含 对 通用 异步 IO 机 制 的 支持 。 套 接 字 机 制 有 
自己 的 方式 来 处 理 异 步 JO， 但 是 在 Single UNIX Specification 中 没有 标准 化 。 一 些 文献 把 经 典 的 
基于 套 接 字 的 异步 IO 机 制 称 为 “基于 信号 的 HO”， 以 区 别 于 实时 扩展 中 的 异步 IO 机 制 。 

在 基于 套 接 字 的 异步 JO 中 ， 当 能 够 从 套 接 字 中 读 取 数 据 ， 或 者 套 接 字 写 队 列 中 的 空间 变 得 
可 用 时 ， 可 以 安排 发 送信 号 SIGIO。 通 过 两 个 步骤 来 使 用 异步 IO: 

(D 建立 套 接 字 拥有 者 关系 ， 信 号 可 以 被 传送 到 合适 的 进程 。 

(2) 通知 套 接 字 当 IMO 操 作 不 会 阻塞 时 发 信号 告 
可 以 使 用 三 种 方式 来 完成 第 一 个 步骤 : 

(D) 在 fcnt1 使 用 F_SETOWN 命 令 。 

(2) 在 ioct1 中 使 用 FIOSETOWN 命 令 。 

(3) 在 ioct1 中 使 用 SITIOCSPGRP 命 令 。 

ZERE THE, AAMER: 

(D) 在 fcnt1l 中 使 用 F_SETFL 命 令 并 且 启 用 文件 标志 0_ASYNC。 

(2) 在 ioct1l 中 使 用 FIOASYNC。 

虽然 有 不 少 选 择 ， 但 不 是 普遍 得 到 支持 。 表 16-11 总 结 了 本 书 讨论 平台 对 这 些 选 项 的 支持 情 
况 。 表 中 以 。 显 示 提 供 支 持 ， 以 + 显示 支持 依赖 于 特定 的 域 。 例 如 ， 在 Linux 上，UNIX 域 套 接 
字 不 支持 FIOSETOWN 和 SIOCSPGRP。 


表 16-11 异步 套 接 字 i/O 管 理 命令 






| F_SETOWN, pid) 

ioctl(fd, FIOSETOWN, pid) d 

ioctl(fd, SIOCSPGRP, pid) 
fentl(fd, F SETFL, flags!O ASYNC) 
ioctl(fd, FIOASYNC, &n); 
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16.9 小 结 


在 本 章 中 ， 考 查 了 了 PC 机 制 ， 这 种 机 制 允 许 一 个 进程 与 另外 一 个 进程 通信 ， 无 论 是 不 同 的 机 

器 上 还 是 同一 机 器 中 。 讨 论 了 套 接 字 端 点 如 何 命名 ， 在 连接 服务 器 时 ， 如 何 发 现 所 要 用 的 地 址 。 
我 们 给 出 了 采用 无 连接 的 套 接 字 (例如 ， 基 于 数据 报 ) 和 面向 连接 套 接 字 的 客户 端 和 服务 

器 的 例子 。 简 要 讨论 了 异步 和 非 阻塞 的 套 接 字 IO ， 以 及 用 于 管理 套 接 字 选 项 的 接口 。 
在 下 一 章 ， 将 会 考查 一 些 高 级 IPC 主 题 ， 包 括 在 同一 台 机 器 上 如 何 使 用 套 接 字 传 送 文件 描 

述 符 。 

习题 

16.1 写 一 个 程序 判断 系统 的 字 节 序 。 

16.2 写 一 个 程序 ， 在 至 少 两 种 不 同 的 平台 上 打印 出 所 支持 套 接 字 的 stat 结 构成 员 ， 并 且 描 述 
这 些 结 果 不 同 之 处 。 

16.3 程序 清单 16-5 中 的 程序 提供 仅 单 一 端点 的 服务 。 修 改 这 个 程序 ， 使 其 同时 支持 多 个 端点 
的 服务 (每 个 具有 不 同 的 地 址 )。 

16.4 写 一 个 客户 端 程序 和 一 个 服务 端 程序 ， 返 回 指定 主机 上 当前 运行 的 进程 数量 。 

16.5 在 程序 清单 16-6 的 程序 中 ， 服 务 器 等 待 子 进程 执行 uptime 命 令 ， 子 进程 完成 后 退出 ， 服 
务 器 才 接 受 下 一 个 连接 请 求 。 重 新 设计 服务 器 ， 使 得 为 一 个 请 求 服务 时 并 不 耽误 处 理 到 
来 的 连接 请 求 。 

16.6 SATENE: 一 个 在 套 接 字 上 允许 异步 1O， 一 个 在 套 接 字 禁 止 异步 JO。 使 用 表 16-11 
来 保证 函数 能 够 在 所 有 平台 上 运行 ， 并且 支 持 尽 可 能 多 的 套 接 字 类 型 。 
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高 级 进程 间 通 信 


17.1 引言 


前 面 两 章 讨 论 了 UNIX 系 统 提供 的 各 种 LIPC， 包 括 管道 和 套 接 字 。 本 章 介绍 两 种 高 级 IPC: 
基于 STREAMS 的 管道 (STREAMS-based pipe) 以 及 UNIX 域 套 接 字 (UNIX domain socket), 
并 说 明 它 们 的 应 用 方法 。 使 用 这 些 IPC， 可 以 在 进程 间 传 送 打 开 文 件 描述 符 。 服 务 进程 可 以 使 
它们 的 打开 文件 描述 符 与 指定 的 名 字 相 关联 ， 客 户 进程 可 以 使 用 这 些 名 字 与 服务 进程 通信 。 我 
们 会 了 解 到 操作 系统 如 何 为 每 一 个 客户 进程 提供 一 个 独 用 的 IPC 通 道 。 构 成 本 章 所 述 技术 基础 
的 很 多 思想 来 自 于 Pressotto 和 Ritchie[1990] 的 论文 。 


17.2 基于 STREAMS 的 管道 


基于 STREAMS 的 管道 (简称 为 STREAMS 管 道 ，STREAMS pipe) 是 一 个 双向 (ERI) 
管道 。 单 个 STREAMS 管 道 就 能 向 父 、 子 进程 提供 双向 的 数据 流 。 


215.1%, Solaris& STREAMS i, Linux 6) of i Haw ©4388 T STREAMS ik, 


图 17-1 显 示 了 观察 STREAMS 管 道 的 两 种 方式 。 它 与 图 15-1 的 唯一 区 别 是 双向 箭头 连 线 ， 
为 STREAMS 管 道 是 全 双 工 的 ， 数 据 可 以 双向 流动 。 


用 户 进程 用 户 进 程 


或 
fd[o] fall] 





图 17-1 观察 STREAMS 管 道 的 两 种 方式 


如 若 从 内 部 观察 STREAMS 管 道 ( 图 17-2)， 可 以 看 到 它 简单 得 只 包含 两 个 流 首 ， 每 个 流 首 
HBAJ (WQ) 指向 另 一 个 流 首 的 读 队 列 (RQ)， 写 入 管道 一 端的 数据 被 放 入 另 一 端的 读 队 
列 的 消息 中 。 

因为 STREAMS 管 道 是 一 个 流 ， 所 以 可 将 STREAMS 模 块 压 入 到 该 管道 的 任 一 端 ( 图 17-3)。 
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但 是 ， 如 果 我 们 在 一 端 压 人 了 一 个 模块 ， 那 么 并 不 能 在 另 一 端 弹出 该 模块 。 如 果 想 要 删除 它 ， 
则 必须 从 原 压 人 端 删除 。 


fd[0] fd[1] 





图 17-3 带 模块 的 STREAMS 管 道内 部 结构 


假定 不 做 类 似 于 压 人 模块 这 样 复杂 的 处 理 ， 那 么 ， 除 了 支持 在 streamio(7) 中 描述 的 大 多 
数 流 ioct1 命 令 外 ，STREAMS 管 道 的 运行 行为 与 非 STREAMS 管 道 并 无 差别 。 在 17.2.2 节 ， 我 
们 将 见 到 一 个 实例 ， 它 将 一 个 流 模块 压 人 STREAMS 管 道中 ， 当 我 们 在 文件 系统 中 给 管道 一 个 
名 字 时 ， 它 提供 了 唯一 连接 。 





下 面 用 一 个 STREAMS 管 道 再 次 实现 程序 清单 15-9 中 的 协同 进程 实例 。 程 序 清 单 17-1 是 新 的 
main 函 数 。add2 协 同 进程 与 程序 清单 15-8 中 的 相同 。 本 程序 调用 了 创建 单个 STREAMS 管 道 的 
新 函数 s_pipe。( 下 面 紧 接着 将 说 明 该 函数 的 STREAMS 管 道 和 UNIX 域 套 接 字 版 本 。) 


程序 清单 17-1 用 STREAMS 管 道 驱动 adda2 过 滤 进 程 的 程序 
#include "apue.h" 
static void sig pipe(int); /* our signal handler */ 


int 
main (void) 


int n; 
int fd[2]; 
pid t pid; 


char line [MAXLINE] ; 


if (signal (SIGPIPE, sig pipe) == SIG_ERR) 
err sys("signal error"); 


if (s pipe(fd) « 0) /* need only a single stream pipe */ 
err _sys("pipe error"); 


if ((pid = fork()) « o) { 
err sys("fork error"); 
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} else if (pid > 0) { /* parent */ 
close (fd[11); 
while (fgets(line, MAXLINE, stdin) !- NULL) ( 
n - strlen(line); 
if (write(fd[0], line, n) !- n) 


err_sys("write error to pipe"); 

if ((n = read(fd[0], line, MAXLINE)) < 0) 
err SyS("read error from pipe"); 

if (n == 0) { 
err_msg("child closed pipe") ; 


break; 
} 
line[n] = 0; /* null terminate */ 
if (fputs(line, stdout) == EOF) 


err_sys("fputs error"); 
} 


if (ferror (stdin) ) 
err_sys("fgets error on stdin"); 
exit (0); 
} else { /* child */ 
close (fd[0]); 
if (fd[1] != STDIN FILENO && 
dup2(fd[1], STDIN FILENO) !- STDIN FILENO) 
err Ssys("dup2 error to stdin"); 
if (fd[1] != STDOUT FILENO && 
dup2(fd[1], STDOUT FILENO) != STDOUT FILENO) 
err sys("dup2 error to stdout"); 
if (execl("./add2", "add2", (char *)0) < 0) 
err_sys("execl error"); 
} 
exit (0); 


} 


static void 
sig_pipe(int signo) 


printf ("SIGPIPE caught\n") ; 
exit (1); 


} 


父 进 程 只 使 用 faQ[0] ， 子 进程 只 使 用 fa[1] 。 因 为 STREAMS 管 道 的 每 一 端 都 是 全 双 工 的 ， 
所 以 父 进程 读 、 写 faQ[0] ， 而 子 进程 将 fa [1] 复 制 到 标准 输入 和 标准 输出 。 图 17-4 显 示 了 由 此 
构成 的 各 描述 符 。 注 意 ， 除 了 STREAMS 管 道 的 全 双 工 性 质 外 ， 该 实例 并 没有 使 用 STREAMS 管 
道 的 其 他 特性 ， 所 以 如 果 使 用 不 是 基于 STREAMS 的 全 双 工 管道 ， 它 同样 能 行 。 


父 进程 子 进 程 (协同 进程 ) 





图 17-4 为 协同 进程 所 作 的 描述 符 安排 
Rago [1993] 较 详细 地 描述 了 基于 STREAMS 的 管道 。 回 忆 表 15-1，FreeBSD 支持 全 双 工 管道 ， 但 


这 些 管道 并 不 是 基于 STREAMS 机 制 的 。 
M 
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s_Pipe 畏 数 定义 为 与 标准 Pipe 函数 类 似 。 它 的 调用 参数 与 pipe 相 同 ， 但 返回 的 描述 符 
以 读 一 写 模 式 打开 。 


实例 ， 基 于 STREAMS 的 s_pipe 函 数 


程序 清单 17-2 是 基于 STREAMS 的 s_pipe 函 数 版 本 。 它 只 是 简单 地 调用 创建 全 双 工 管道 的 
标准 pipe 函 数 。 
程序 清单 17-2 ”基于 STREAMS 的 s_pipe 函 数 版 本 
#include "apue .hn 


/* 

* Returns a STREAMS-based pipe, with the two file descriptors 
* returned in fd[0] and fd[1]. 

ial f 

int 
8 pipe(int fd[2]) 

{ 


return (pipe (fd) ) ; 





E 
17.2.1 命名 的 STREAMS 管 道 


通常 ， 管 道 仅 在 相关 进程 之 间 使 用 : 子 进程 继承 父 进程 的 管道 。 在 15.5 节 ， 我 们 见 到 无 关 
进程 可 以 使 用 FIFO 进 行 通信 ， 但 是 这 仅仅 提供 单 向 通信 。STREAMS 机 制 提供 了 一 种 途径 ， 使 
得 进程 可 以 给 予 管道 一 个 文件 系统 中 的 名 字 。 这 就 避免 了 单 向 FIFO 的 问题 。 

我 们 可 以 用 fattach 函 数 给 STREAMS 管 道 一 个 文件 系统 中 的 名 字 。 


#include <stropts.h> 


int fattach(int filedes, const char *path); 


返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 -1 


Path 参 数 必须 引用 一 个 现存 的 文件 ， 调 用 进程 应 当 或 者 拥有 该 文件 并 且 对 它 具 有 写 权 限 , 或 者 
正在 以 超级 用 户 特权 运行 。 

一 旦 STREAMS 管 道 连接 到 文件 系统 名 字 空 间 ， 那 么 原来 使 用 该 名 字 的 底层 文件 就 不 再 是 
可 访问 的 。 打 开 该 名 字 的 任 一 进程 将 能 访问 相应 管道 ， 而 不 是 访问 原先 的 文件 。 在 调用 
fattach 之 前 打开 底层 文件 的 任 一 进程 可 以 继续 访问 该 文件 。 确 实 ， 一 般 而 言 ， 这 些 进 程 并 不 
知道 该 名 字 现 在 引用 了 另外 一 个 文件 。 

图 17-5 显 示 了 连接 到 路 径 名 /tmp/pPipe 的 一 条 管道 。 只 有 管道 的 一 - 端 连 接 到 文件 系统 中 一 
个 名 字 上 。 另 一 端 用 来 与 打开 该 连接 文件 名 的 进程 通信 。 虽 然 fattach 函 数 可 将 任何 种 类 的 
STREAMS 文 件 描述 符 与 文件 系统 中 的 一 个 名 字 相连 接 ， 但 它 最 主要 用 于 将 一 个 名 字 给 予 -- 





STREAMS 管 道 。 


一 个 进程 可 以 调用 faetach 函 数 撤销 STREAMS 管 道 文件 与 文件 系统 中 名 字 的 关联 关系 。 


#include «stropts.h» 


int fdetach(const char *path); 





返回 值 ， 若 成 功 则 返回 9， 若 出 错 则 返回 一 
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/tmp/pipe 





图 17-5 一 条 管道 安装 到 文件 系统 的 一 个 名 字 上 


在 调用 fdqetach 函 数 之 后 ， 先 前 依靠 打开 Path 而 能 访问 STREAMS 管 道 的 进程 仍 可 继续 访 
问 该 管道 ， 但 是 在 此 之 后 打开 path 的 进程 将 访问 驻 留 在 文件 系统 中 的 底层 文件 。 


17.2.2 唯一 连接 


虽然 我 们 可 以 将 STREAMS 管 道 的 一 端 连接 到 文件 系统 的 名 字 空 间 ， 但 是 如 果 多 个 进程 都 
想 要 用 命名 STREAMS 管 道 与 服务 器 进程 通信 ， 那 么 仍然 存在 问题 。 若 几 个 客户 进程 同时 将 数 
据 写 至 一 管道 ， 那 么 这 些 数 据 就 会 混合 交错 。 即 使 我 们 保证 客户 进程 写 的 字 节 数 小 于 
PIPE_BUF， 使 得 写 操作 是 原子 性 的 ， 但 是 仍 无 法 保证 服务 器 进程 将 数据 送 回 所 期 望 的 某 个 客 
户 进程 ， 也 无 法 保证 该 客户 进程 一 定 会 读 此 消息 。 当 多 个 客户 进程 同时 读 一 管道 时 ， 我 们 无 法 
调度 具体 哪 一 个 客户 进程 去 读 我 们 所 发 送 的 消息 。 

connld STREAMS 模 块 解决 了 这 一 问题 。 在 将 一 个 STREAMS 管 道 连接 到 文件 系统 的 一 个 
名 字 之 前 ， 服 务 器 进程 可 将 conn1d 模 块 压 和 人 要 被 连接 管道 的 一 端 。 其 结果 示 于 图 17-6。 


服务 器 进程 客户 进程 


/tmp/pipe p” 











图 17-6 为 唯一 连接 设置 connla 


在 图 17-6 中 ， 服 务 器 进程 已 将 管道 的 一 端 连接 至 /tmp/pipe。 我 们 用 虚线 指示 客户 进程 正 
在 打开 所 连接 的 STREAMS 管 道 。 一 旦 打开 操作 完成 ， 则 服务 器 进程 、 客 户 进程 和 STREAMS 管 
道 之 间 的 关系 示 于 图 17-7 中 。 

客户 进程 决 不 会 接收 到 它 所 打开 管道 端的 打开 文件 描述 符 。 作 为 替代 ， 操 作 系统 创建 了 一 
个 新 管道 ， 对 客户 进程 返回 其 一 端 ， 作 为 它 打开 /tmp/pipe 的 结果 。 系 统 将 此 新 管道 另 一 端 
的 文件 描述 符 经 由 已 存在 的 连接 管道 发 送 给 服务 器 进程 ， 结 果 在 客户 进程 和 服务 器 进程 之 间 构 
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服务 器 进程 


/tmp/pipe 





图 17-7 用 conn19 构 造 唯一 连接 


成 了 唯一 连接 。 我 们 将 在 17.4.1 中 了 解 到 用 STREAMS 管 道 传送 文件 描述 符 的 机 制 。 


fattach 闷 数 是 在 mount 系 统 调用 之 上 构造 的 。 这 种 设施 被 认为 是 安装 流 (mounted stream)。 安 
装 流 和 conn1d 模 块 是 由 Presotto 和 Ritchie[1990] 为 Research UNIX 系 统 开发 的 。 然 后 ，SVR4 采 用 了 这 些 
机 制 。 


现在 ， 我 们 将 开发 三 个 函数 ， 使 用 这 些 函 数 可 以 创建 在 无 关 进程 之 间 的 唯一 连接 。 这 些 函 
数 模仿 了 在 16.4 节 中 讨论 过 的 面向 连接 的 套 接 字 函 数 。 在 此 处 ， 我 们 使 用 STREAMS 管 道 作为 
底层 通信 机 制 ， 在 17.3 节 我 们 则 将 见 到 用 UNIX 域 套 接 字 实现 的 同样 这 三 个 函数 。 





#include "apue.h" 










int serv_listen(const char *name) ; 
返回 值 : SRAM STAIR TT, PTR fo f 
int serv_accept (int listenfd, uid_t *uidptr) ; 
返回 值 ， 若 成 功 则 返回 新 文件 描述 符 ， 若 出 错 则 返回 负 值 


int cli_conn(const char *name) ; 


返回 值 : 车 成 功 则 返回 文件 描述 符 ， 若 出 错 则 返回 负 值 





服务 器 进程 调用 serv_1i sten 函 数 (程序 清单 17-3) 声明 它 要 在 一 个 众所周知 的 名 字 
(文件 系统 中 的 某 个 路 径 名 ) 上 侦 听 客户 进程 的 连接 请 求 。 当 客 户 进程 想 要 连接 至 服务 器 进程 
时 ， 它 们 将 使 用 该 名 字 。 serv 1isten 国 数 的 返回 值 是 STREAMS 管 道 的 服务 器 进程 端 。 

程序 清单 17-3 使 用 STREAMS 管 道 的 serv_listen 函 数 

#include "apue.h" 


#include «fcntl.h» 
#include <stropts.h> 





/* pipe permissions: user rw, group rw, others rw */ 
#define FIFO MODE (S_IRUSR|S_IWUSR|S_IRGRP|S_IWGRP|S IROTH|S IWOTH) 


/* 
* Establish an endpoint to listen for connect requests. 
* Returns fd if all OK, «0 on error 
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*/ 
int 
serv listen(const char *name) 
{ 
int tempfd; 
int £d[2]; 
/* 
* Create a file: mount point for fattach(). 
*/ 
unlink (name); 
if ((tempfd = creat(name, FIFO MODE)) « 0) 
return(-1); 
if (close(tempfd) « 0) 
return(-2); 
if (pipe(fd) « 0) 
return(-3); 
/* 
* Push connld & fattach() on fd[1). 
*/ 
if (ioctl(fd[1], I PUSH, "connld") « O) { 
close (fd[0]); 
close(fd[1]); 
return (-4); 


} 
if (fattach(fd[1], name) « 0) { 
close(fd[0]); 
close (fd[1]); 
return (-5); 
close (fd[1]); /* fattach holds this end open */ 


return(fd[0]); /* fd[0] is where client connections arrive */ 


) 


服务 器 进程 使 用 serv_accept 函 数 (程序 清单 17-4) 等 待 客户 进程 连接 请 求 的 到 达 。 当 
一 个 请 求 到 达 时 ， 系 统 自动 创建 一 个 新 的 STREAMS 管 道 ，serv_accept 函 数 向 服务 器 进程 返 
回 该 STREAMS 管 道 的 一 端 。 另 外 ， 客 户 进程 的 有 效用 户 ID 存 放 在 uidptr 指 向 的 存储 区 中 。 


程序 清单 17-4 使 用 STREAMS 管 道 的 serv_accept 函数 


#include "apue.h" 
#include <stropts.h> 


/* 
* Wait for a client connection to arrive, and accept it. 
* We also obtain the client’s user ID. 
* Returns new fd if all OK, <0 on error. 
*/ 

int 

serv_accept (int listenfd, uid_t *uidptr) 


{ 








struct strrecvfd recvfd; 


if (ioctl(listenfd, I RECVFD, &recvfd) « 0) 


return(-1); /* could be EINTR if signal caught */ 
if (uidptr !- NULL) 

*uidptr - recvfd.uid; /* effective uid of caller */ 
return(recvfd.fd);  /* return the new descriptor */ 
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客户 进程 调用 cl1i_conn 函 数 (程序 清单 17-5) 连接 至 服务 器 进程 。 客 户 进程 指定 的 参数 
name 必 须 与 服务 器 进程 调用 serv_1isten 函 数 时 所 用 的 相同 。 函 数 返 回 时 ， 客 户 进程 得 到 接 
连 至 服务 器 进程 的 文件 描述 符 。 


程序 清单 17-5 用 STREAMS 管 道 的 cli_conn 范 数 


#include "apue.h" 
#include «fcntl.h» 
#include «stropts.h» 


/* 
* Create a client endpoint and connect to a server. 
* Returns fd if all OK, «0 on error. 
x 

int 

cli conn(const char *name) 


int fd; 


/* open the mounted stream */ 

if ((fd = open(name, O RDWR)) « 0) 
return(-1); 

if (isastream(fd) == 0) { 
close (fd); 
return (-2) ; 


return (fd); 


} 





我 们 对 返回 的 描述 符 是 否 引 用 STREAMS 设 备 进 行 了 二 次 检验 ， 以 防 服务 器 进程 没 被 启动 
而 路 径 名 仍 存在 于 文件 系统 中 。 在 17.6 节 中 ， 我 们 将 会 了 解 到 如 何 使 用 这 三 个 函数 。 


17.3 UNIX 域 套 接 字 


UNIX 域 套 接 字 用 于 在 同一 台 机 器 上 运行 的 进程 之 间 的 通信 。 虽然 因特网 域 套 接 字 可 用 于 
同一 目的 ， 但 UNIX 域 套 接 字 的 效率 更 高 。UNIX 域 套 接 字 仅 仅 复制 数据 ， 它们 并 不 执行 协议 处 
理 ， 不 再 要 添加 或 删除 网 络 报头 ， 无 需 计 算 检 验 和 ， 不 要 产生 顺序 号 ， 无 需 发 送 确认 报 文 。 

UNIX 域 套 接 字 提 供 流 和 数据 报 两 种 接口 。UNIX 域 数据 报 服 务 是 可 靠 的 ， 既 不 会 丢失 消息 
也 不 会 传递 出 错 。UNIX 域 套 接 字 是 套 接 字 和 管道 之 间 的 混合 物 。 为 了 创建 一 对 非 命名 的 、 相 
互 连 接 的 UNIX 域 套 接 字 ， 用 户 可 以 使 用 它们 面向 网 络 的 域 套 接 字 接口 ， 也 可 使 用 
socketpairfAR, 


#include «sys/socket.h» 


int socketpair(int domain, int type, int protocol, int sockfd[21); 


返回 值 : 车 成 功 则 返回 0 车 出 错 则 返回 -1 


虽然 该 接口 具有 足够 的 一 般 性 ，socketpair 可 用 于 任意 域 ， 但 操作 系统 通常 仅 对 UNIX 
域 提供 支持 。 


实例 ;使 用 UNIX 域 套 接 字 的 s_pipe 函 数 
程序 清单 17-6 是 基于 套 接 字 的 s_pipe 函 数 版 本 ,该 函数 曾 出 现 于 程序 清单 17-2。s_pipe 
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函数 创建 一 对 相连 接 的 UNIX 域 流 套 接 字 。 
程序 清单 17-6 ese_pipe 函 数 的 套 接 字 版 本 


#include "apue.h" 

#include «sys/socket.h» 

/* 

* Returns a full-duplex "stream" pipe (a UNIX domain socket) 
* with the two file descriptors returned in fd[0O] and fd[1l. 
w/ 

int 

s pipe(int fd[21) 


return(socketpair(AF UNIX, SOCK STREAM, 0, fd)); 





某 些 基于 BSD 的 系统 使 用 UNIX 域 套 接 字 实 现 管道 。 但 当 调用 Pipe 时， 第 一 描述 符 的 写 端 和 第 二 
描述 符 的 读 端 都 被 关闭 。 为 了 得 到 全 双 工 管道 ,我们 必须 直接 调用 socketpair。 
国 


17.3.1 命名 UNIX 域 套 接 字 


虽然 socketpaiz 函 数 创建 相互 连接 的 一 对 套 接 字 ， 但 是 每 一 个 套 接 字 都 没有 名 字 。 这 意 
味 着 无 关 进程 不 能 使 用 它们 。 

在 16.3.4 节 ， 我 们 学 习 了 如 何 将 一 个 地 址 绑 定 一 因特网 域 套 接 字 。 恰 如 因特网 域 套 接 字 一 
样 ， 我 们 也 可 以 命名 UNIX 域 套 接 字 ， 并 可 将 其 用 于 告示 服务 。 但 是 要 注意 的 是 ，UNIX 域 套 接 
字 使 用 的 地 址 格式 不 同 于 因特网 域 套 接 字 。 

回忆 16.3 节 ， 套 接 字 地 址 格式 可 能 随 实 现 而 变 。UNIX 域 套 接 字 的 地 址 由 sockaddr_un 结 
构 表 示 。 在 Linux 2.4.22 和 Solaris 9 中 ，sockaddr_un 结 构 按 下 列 形式 定义 在 头 文件 
<Sys/un.h> 中 : 


struct sockaddr_un { 
sa family t sun family; /* AF UNIX */ 
char sun path[108]1; /* pathname */ 


}; 
但 是 在 FreeBSD 5.2.1 和 Mac OS X 10.3 中 ，sockaddr_un 结 构 定义 如 下 : 


struct sockaddr_un { 


unsigned char sun len; /* length including null */ 
sa family t sun family; /* AF UNIX */ 
char sun path[104]; /* pathname */ 


) 

sockaddr_un 结 构 的 sun_pathb 成 员 包含 一 路 径 名 。 当 我 们 将 一 地 址 绑 定 至 UNIX 域 套 接 
字 时 ， 系 统 用 该 路 径 名 创建 一 类 型 为 Ss_IFSOCK 的 文件 。 

该 文件 仅 用 于 向 客户 进程 告知 套 接 字 名 字 。 该 文件 不 能 打开 ， 也 不 能 由 应 用 程序 用 于 通信 。 

如 果 当 我 们 试图 绑 定 地 址 时 ， 该 文件 已 经 存在 ， 那 么 bina 请 求 失败 。 当 关闭 套 接 字 时 ， 
并 不 自动 删除 该 文件 ， 所 以 我 们 必须 确保 在 应 用 程序 终止 前 ， 对 该 文件 执行 解除 链接 操作 。 


3c i 
程序 清单 17-7 是 一 个 例子 ， 它 将 一 地 址 绑 定 一 UNIX 域 套 接 字 。 
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程序 清单 17-7 将 一 个 地 址 绑 定 一 UNIX 域 套 接 字 


#include "apue .hr 
#include <sys/socket .h> 
#include «sys/un.h» 


int 
main (void) 


int fd, size; 
struct sockaddr_un un; 


un.sun_family = AF_UNIX; 
Strcpy(un.sun path, "foo.socket") ; 
if ((fd = socket(AF UNIX, SOCK STREAM, 0)) < 0) 
err Sys("socket failed"); 
size = offsetof (struct sockaddr un, sun path) + strlen(un.sun path); 
if (bind(fd, (struct sockaddr *)&un, size) < 0) 
err_sys ("bind failed"); 
printf ("UNIX domain socket bound\n"); 
exit (0); 


} 


当 运 行 此 程序 时 ，binq 请 求 成 功 执行 ， 但 是 如 车 第 二 次 运行 该 程序 ， 则 出 错 返 回 ， 其 原 
因 是 该 文件 已 经 存在 。 在 删 去 该 文件 之 前 ， 程 序 清 单 17-7 不 会 成 功 运行 。 


$ ./a.out 运行 该 程序 

UNIX domain socket bound 

$ 1s -1 foo.socket 查看 套 接 字 文 件 
SrwXrwXr-x 1 sar 0 Aug 22 12:43 foo.socket 

$ ./a.out 试图 再 次 运行 该 程序 
bind failed: Address already in use 

$ rm foo. socket PIR IZ SIE 
$ ./a.out 第 3 次 运行 该 程序 
UNIX domain socket bound 现在 成 功 啦 


确定 绑 定 地 址 长 度 的 方法 是 ， 先 确定 sun_path 成 员 在 sockaddr_un 结 构 中 的 偏 移 量 ， 
然后 将 此 与 路 径 名 长 度 (不 包括 终止 null 字 符 ) 相 加 。 因 为 在 sun_path 之 前 的 成 员 与 实现 相 
关 ， 所 以 我 们 使 用 <stadef .h> 头 文件 (apue.h 中 包括 ) 中 的 of fsetof 宏 计算 sun_path 
成 员 从 结构 开始 处 的 偏 移 量 。 如 果 查 看 <stddaef .Ph>， 则 可 见 到 类 似 于 下 列 形式 的 定义 : 


#define offsetof (TYPE, MEMBER) ((int)&( (TYPE *)0) ->MEMBER) 
假定 该 结构 从 地 址 0 开始 ， 此 表达 式 求 得 成 员 起 始 地 址 的 整 型 值 。 EJ 
17.3.2 唯一 连接 


最 务 器 进程 可 以 使 用 标准 bind、1isten 和 accept 函 数 ， 为 客户 进程 安排 一 个 唯一 UNIX 
域 连接 (unique UNIX domain connection)。 客 户 进程 使 用 connect 与 服务 器 进程 联系 ， 服 务 器 
进程 接受 了 connect 请 求 后 ， 在 服务 器 进程 和 客户 进程 之 间 就 存在 了 唯一 连接 。 这 种 风格 的 操 
作 与 我 们 在 程序 清单 16-4 和 程序 清单 16-5 中 所 示 的 对 因特网 域 套 接 字 的 操作 相同 。 

程序 清单 17-8 示 出 了 serv_1isten 函 数 的 UNIX 域 套 接 字 版 本 。 


程序 清单 17-8 UNIX Fiserv listen 


#include "apue.h" 
#include <sys/socket .h> 
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#include <sys/un.h> 
#include <errno.h> 


#define QLEN 10 
/* 


* Create a server endpoint of a connection. 

* Returns fd if all OK, «0 on error. 

*/ 

int 

serv listen(const char *name) 

{ 
int fd, len, err, rval; 
struct sockaddr_un un; 


/* create a UNIX domain stream socket */ 
if ((fd = socket(AF UNIX, SOCK STREAM, 0)) < 0) 
return(-1); 597 


unlink (name); /* in case it already exists */ 


/* fill in socket address structure */ 

memset(&un, 0, sizeof(un)); 

un.sun family = AF UNIX; 

Strcpy(un.sun path, name); 

len = offsetof (struct sockaddr un, sun path) + strlen(name); 


/* bind the name to the descriptor */ 

if (bind(fd, (struct sockaddr *)&un, len) « 0) { 
rval - -2; 
goto errout; 


) 


if (listen(fd, QLEN) « 0) [ /* tell kernel we're a server */ 
rval - -3; 
goto errout; 


} 


return (fd) ; 


errout: 
err = errno; 
close (fd) ; 
errno = err; 
return (rval); 


} 


首先 ， 我 们 调用 socket 创 建 一 个 UNIX 域 套 接 字 。 然 后 将 欲 赋予 套 接 字 的 众所周知 路 径 名 
填 人 sockaddr_un 结 构 。 该 结构 是 调用 bindq 的 参数 。 注 意 ， 我 们 不 需要 设置 某 些 平台 提供 的 
sun_len 字 段 ， 操 作 系统 用 传送 给 bind 函 数 的 地 址 长 度 设 置 该 字段 。 

最 后 ， 调 用 1isten 函 数 (16.4 节 ) 以 通知 内 核 该 进程 将 作为 服务 器 进程 等 待 客户 进程 的 
连接 请 求 。 当 收 到 一 个 客户 进程 的 连接 请 求 后 ， 服 务 器 进程 调用 serv_accept 函 数 (程序 清 
单 17-9)。 


程序 清单 17-9 UNIX BES serv accept HH 


#include "apue.h" ? 
#include «sys/socket.h» 
#include <sys/un.h> 
#include «time.h» 
#include <errno.h> 





#define STALE 30 /* client's name can’t be older than this (sec) */ 


bbs.theithome.com 











480 #17% 高 级 进程 间 通 信 


* Wait for a client connection to arrive, and accept it. 
* We also obtain the client’s user ID from the pathname 
* that it must bind before calling us. 

* Returns new fd if all OK, <0 on error 

*/ 

int 

serv accept(int listenfd, uid t *uidptr) 


{ 


int clifd, len, err, rval; 
time_t staletime; 

struct sockaddr_un un; 

struct stat Statbuf; 


len = sizeof (un); 
if ((clifd = accept(listenfd, (struct sockaddr *)&un, &len)) « 0) 
return(-1); /* often errno-EINTR, if signal caught */ 


/* obtain the client's uid from its calling address */ 
len -= offsetof (struct sockaddr un, sun path); /* len of pathname */ 
un.sun path[len] - 0; /* null terminate */ 


if (stat(un.sun path, &statbuf) < 0) { 
rval = -2; 
goto errout; 


#ifdef S ISSOCK /* not defined for SVR4 */ 


if (S ISSOCK(statbuf.st mode) == 0) { 
rval = -3; /* not a socket */ 
goto errout; 

} 

#endif 

if ((statbuf.st_mode & (S_IRWXG | S_IRWXO)) || 

(statbuf.st_mode & S_IRWXU) != S_IRWXU) { 
rval = -4; /* is not rwx------ */ 


goto errout; 


} 


staletime = time (NULL) - STALE; 
if (statbuf.st_atime < staletime || 
statbuf.st_ctime < staletime || 
statbuf.st_mtime < staletime) { 
rval = -5; /* i-node is too old */ 
goto errout; 


} 


if (uidptr != NULL) 

*uidptr = statbuf.st_uid; /* return uid of caller */ 
unlink(un.sun path); /* we're done with pathname now */ 
return(clifd); 


errout: 
err - errno; 
close(clifd); 


errno - err; 
return (rval); 





服务 器 进程 在 调用 serv_accept 中 阻塞 以 等 待 一 客户 进程 调用 cli_conn。 从 accept 返 
回 时 ， 返 回 值 是 连接 到 客户 进程 的 靳 新 的 描述 符 。( 这 有 些 类 似 于 conn1ld 模 块 对 于 STREAMS 
子 系统 所 做 的 那样 。) 另外 ，accept 函 数 也 经 由 其 第 二 个 参数 (指向 sockaddr_un 结 构 的 指 
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针 ) 返回 客户 进程 赋予 其 套 按 字 的 路 径 名 (包含 客户 进程 ID 的 名 字 )。 接 着 ,程序 在 此 路 径 名 
结尾 处 填补 null 字 符 ， 然 后 调用 stat 函 数 。 这 使 我 们 验证 该 路 径 名 确实 是 一 个 套 接 字 ， 其 权限 
仅 允 许 用 户 - 读 、 用 户 - 写 以 及 用 户 - 执 行 。 我 们 也 验证 与 套 接 字 相 关联 的 3 个 时 间 不 比 当前 时 
间 早 30 秒 。( 回 忆 6.10 节 ，time 国 数 返 回 当前 时 间 和 日 期 ， 单 位 是 秒 ， 起 始点 是 公元 1970 年 1 月 
1H00.00:00, ) : 

如 车 通过 了 所 有 这 些 检验 ， 则 可 认为 客户 进程 的 身份 (其 有 效用 户 ID) 是 该 套 接 字 的 所 有 
者 。 虽 然 这 种 检验 并 不 完善 ， 但 这 是 对 当前 系统 所 能 做 到 的 最 佳 方案 。( 如 若 内 核能 像 处 理 
I_RECVFD ioct1 命 令 那样 ， 使 accept 返 回 有 效用 户 ID ， 则 会 更 好 一 些 。) 

客户 进程 调用 cli_conn 函 数 (程序 清单 17-10) 对 联 向 服务 器 进程 的 连接 进行 初始 化 。 


程序 清单 17-10 用 于 UNIX 域 套 接 字 的 cli_conn 函 数 


#include "apue.h" 
#include <sys/socket .h> 
#include «sys/un.h» 
#include <errno.h> 


#define CLI_PATH "/var/tmp/" /* +5 for pid = 14 chars */ 
#define CLI PERM S IRWXU /* rwx for user only */ 
/* 


* Create a client endpoint and connect to a server. 
* Returns fd if all OK, «0 on error. 
*/ 
int 
cli conn(const char *name) 
{ 
int fd, len, err, rval; 
struct sockaddr_un un; 


/* create a UNIX domain stream socket */ 
if ((fd = socket (AF_UNIX, SOCK_STREAM, 0)) « O) 
return(-1); 


/* fill socket address structure with our address */ 

memset(&un, 0, sizeof(un)); 

un.Sun family = AF UNIX; 

sprintf(un.sun path, "%s%05d", CLI PATH, getpid()); 

len = offsetof(struct sockaddr un, sun path) + strlen(un.sun path); 


unlink(un.sun path); /* in case it already exists */ 
if (bind(fd, (struct sockaddr *)&un, len) « 0) ( 
rval - -2; 


goto errout; 


if (chmod(un.sun path, CLI PERM) « 0) { 
rval - -3; 
goto errout; 


} 


/* fill socket address structure with server's address */ 
memset(&un, 0, sizeof(un)); 
un.sun family - AF UNIX; 
strcpy(un.sun path, name); 
len = offsetof(struct sockaddr un, sun path) + strlen(name); 
if (connect(fd, (struct sockaddr *)&un, len) « 0) { 

rval = -4; 

goto errout; 
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return (fd); 


errout: 
err = errno; 
close (fd); 
errno = err; 
return (rval) ; 


我 们 调用 socket 函数 创建 UNIX 域 套 接 字 的 客户 进程 端 ， 然 后 用 客户 进程 专 有 的 名 字 填 入 


sockaddr_un 结 构 。 

我 们 不 让 系统 为 我 们 选择 一 个 默认 地 址 ， 原 因 是 这 样 处 理 后 ， 服 务 器 进程 将 不 能 区 分 各 个 
客户 进程 。 于 是 ， 我 们 绑 定 我 们 自己 的 地 址 ， 在 开发 使 用 套 接 字 的 客户 端 程序 时 通常 并 不 采用 
这 一 步骤 。 

我 们 绑 定 的 路 径 名 的 最 后 5 个 字符 来 自 客 户 进程 ID。 我 们 调用 unlink， 以 防 访 路径 名 已 经 
存在 。 然 后 ， 调 用 binq 将 名 字 赋 予 客户 进程 套 接 字 。 这 在 文件 系统 中 创建 了 一 个 套 接 字 文 件 ， 
所 用 的 名 字 与 被 绑 定 路 径 名 一 样 。 接 着 ， 调 用 chmoq 关 闭 除 用 户 - 读 、 用 户 -- 写 以 及 用 户 一 执行 
以 外 的 其 他 权限 。 在 serv_accept 中 ， 服 务 器 进程 检验 这 些 权限 以 及 套 接 字 用 户 ID 以 验证 客 
户 进程 的 身份 。 

然后 ， 我 们 必须 填充 另 一 个 sockaddr._un 结 构 ， 这 次 用 的 是 服务 器 进程 众所周知 的 路 径 
名 。 最 后 ， 调 用 connect 函 数 初始 化 与 服务 器 进程 的 连接 。 


17.4 传送 文件 描述 符 


在 进程 间 传 送 打开 的 文件 描述 符 的 能 力 是 非常 有 用 的 ， 可 以 用 它 对 客户 进程 /服务 器 进程 应 
用 进行 不 同 的 设计 。 它 使 一 个 进程 (一般 是 服务 器 进程 ) 能 够 处 理 为 打开 一 个 文件 所 要 求 的 一 
切 操作 (具体 如 将 网 络 名 翻译 为 网 络 地 址 、 拨 号 调制 解 调 器 、 协 商 文 件 锁 等 ) 以 及 向 调用 进程 
送 回 一 描述 符 ， 访 描述 符 可 被 用 于 以 后 的 所 有 UO 函数 。 涉 及 打开 文件 或 设备 的 所 有 细节 对 客户 
进程 而 言 都 是 隐藏 了 的 。 

下 面 进一步 说 明 从 一 个 进程 向 另 一 个 进程 “传送 一 打开 的 文件 描述 符 ” 的 含义 。 回 忆 图 3-2， 
其 中 显示 了 两 个 进程 ， 它 们 打开 了 同一 文件 。 虽 然 它们 共享 同一 v 节 点 表 ， 但 每 个 进程 都 有 它 
自己 的 文件 表 项 。 

当 一 个 进程 向 另 一 个 进程 传送 一 打开 的 文件 描述 符 时 ， 我 们 想 要 发 送 进 程 和 接收 进程 共享 
同一 文件 表 项 。 图 17-8 显 示 了 所 希望 的 安排 。 

在 技术 上 ， 发 送 进 程 实际 上 向 接收 进程 传送 一 个 指向 一 打开 文件 表 项 的 指针 。 该 指针 被 分 
配 存放 在 接收 进程 的 第 一 个 可 用 描述 符 项 中 。( 注 意 ， 不 要 造成 错觉 ， 以 为 发 送 进程 和 接收 进 
程 中 的 描述 符 编号 是 相同 的 ， 通 常 它们 是 不 同 的 .) 两 个 进程 共享 同一 打开 文件 表 项 ， 在 这 一 
点 上 与 fork 之 后 ， 父 、 子 进程 共享 打开 文件 表 项 的 情况 完全 相同 (参见 图 8-1)。 

当 发 送 进程 将 描述 符 传送 给 接收 进程 后 ， 通 常 它 关 闭 该 描述 符 。 发 送 进程 关闭 该 描述 符 并 
不 造成 关闭 该 文件 或 设备 ， 其 原因 是 该 描述 符 对 应 的 文件 仍 被 视 为 由 接收 进程 打开 (即使 接收 
进程 尚未 接收 到 该 描述 符 )。 

下 面 定义 本 章 使 用 的 三 个 函数 以 发 送 和 接收 文件 描述 符 。 本 布 将 会 给 出 对 于 STREAMS 和 
套 接 字 的 这 三 个 国 数 的 不 同 实现 代码 。 
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#include "apue -hn 


int send fd(int fd, int fd to send); 


int send err(int fd, int status, const char *errmsg) ; 


两 个 函数 返回 值 : 若 成 功 则 返回 0， 若 出 错 则 返回 一 1 
int recv fd(int fd, ssize t (*userfunc) (int, const void *, size t)); 


返回 值 ， 若 成 功 则 返回 文件 描述 符 ， 若 出 错 则 返回 负 值 











当前 文件 大 小 











图 17-8 从 顶部 进程 传送 一 个 打开 的 文件 至 底部 进程 


当 一 个 进程 (通常 是 服务 器 进程 ) 希望 将 一 个 描述 符 传 送 给 另 一 个 进程 时 ， 它 调用 sengd_fa 
或 send_err。 等 待 接收 描述 符 的 进程 (客户 进程 ) 调用 recv_fq。 
sengd_fd 经 由 fd 代表 的 STREAMS 管 道 或 UNIX 域 套 接 字 发 送 描述 符 fd_to_send。 


我 们 将 使 用 本 语 8 管道 表 示 可 实现 为 STREAMS 管 道 或 UNIX 域 流 套 接 字 的 双向 通信 通道 ， 


sendq_ezrz 函 数 用 庆 发 送 errasg 以 及 后 随 的 status 字 节 。siarus 的 值 应 在 -1 到 -255 之 间 。 

客户 进程 调用 recv_fd 接 收 一 描述 符 。 如 果 一 切 正常 (发 送 者 调用 了 send_fd)， 则 作为 
函数 值 返 回 非 负 描述 符 。 否则， 返回 值 是 由 send_err 发 送 的 status (一 1 到 一 255 之 间 的 一 个 值 )。 
另外 ， 如 果 服 务 器 进程 发 送 了 一 条 出 错 消 息 ， 则 客户 进程 调用 它 自己 的 userfunc 处 理 该 消息 。 
userfunc 的 第 一 个 参数 是 常量 STDERR_FILENO， 然 后 是 指向 出 错 消 息 的 指针 及 其 长 度 。 
userfunc 冰 数 的 返回 值 是 已 写 的 字 节 数 或 负 的 出 错 编 号 值 。 客 户 进程 常 将 userfunc 指 定 为 通常 的 
write 国 数 。 

我 们 实现 了 用 于 这 三 个 函数 的 我 们 自己 制定 的 协议 。 为 发 送 一 描述 符 ，send_fd 先 发 送 两 
个 0 字 节 ， 然 后 是 实际 描述 符 。 为 了 发 送 一 条 出 错 消 息 ，send_err 发 送 errmsg， 然 后 是 1 个 0 字 
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节 ， 最 后 是 status 字 节 的 绝对 值 (1~255)。recv_fa 读 s 管 道中 所 有 字 节 直至 null 字 符 。null 字 符 
之 前 的 所 有 字符 都 传送 给 调用 者 的 userfunc。recv_fd 读 到 的 下 一 个 字 节 是 status 字 节 。 车 
status 字 节 为 0， 那 么 一 个 描述 符 已 传送 过 来 ， 否 则 表示 没有 描述 符 可 接收 。 

send_err 函 数 在 将 出 错 消息 写 到 STREAMS 管 道 后 ， 即 调用 send_fd 函 数 。 如 程序 清单 
17-11 所 示 。 


程序 清单 17-11 send erri 
#include "apue.h" 


/* 
* Used when we had planned to send an fd using send_fd(), 
* but encountered an error instead. We send the error back 
* using the send_fd()/recv_fd() protocol. 
*/ 
int 
send err(int fd, int errcode, const char *mag) 


{ 


int n; 


if ((n = strlen(msg)) > 0) 
if (writen(fd, msg, n) != n) /* send the error message */ 
return (-1); 


if (errcode >= 0) 
errcode = -1; /* must be negative */ 


if (send fd(fd, errcode) « 0) 
return(-1); 


return(0); 


} 
以 下 两 节 介 绍 函 数 send_fa 和 recv_fd 的 具体 实现 。 
17.4.1 经 由 基于 STREAMS 的 管道 传送 文件 描述 符 


文件 描述 符 用 两 个 ioct1 命 令 经 由 STREAMS 管 道 交换 ， 这 两 个 命令 是 : I_SENDFD 和 
I_RECVFD。 为 了 发 送 一 个 描述 符 ， 将 ioct1 的 第 三 个 参数 设置 为 实际 描述 符 。 这 示 于 程序 清 
单 17-12 中 。 





程序 清单 17-12 STREAMS 管 道 的 eenda_fd 函 数 


#include "apue .hn 
#include <stropts.h> 


/* 

* Pass a file descriptor to another process. 
* Tf fd<0, then -fd is sent back instead as the error status. 
*/ 

int 

send fd(int fd, int fd to send) 


char buf [2] ; /* send fd()/recv fd() 2-byte protocol */ 
buf [0] = 0; /* null byte flag to recv fd() */ 
if (fd to send « 0) { 
buf[1] = -fd to send; /* nonzero status means error */ 
if (buf[1] == 0) 
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buf [1] = 1; /* -256, etc. would screw up protocol */ 


} else { 

buf[1] = 0; /* zero status means OK */ 
} 
if (write(fd, buf, 2) != 2) 


return (-1); 


if (fd to send >= 0) 
if (ioctl(fd, I SENDFD, fd to send) « 0) 
return(-1); 
return (0); 





当 接 收 一 个 描述 符 时 ，iocti 的 第 三 个 参数 是 一 指向 strrecvfd 结构 的 指针 。 


struct strrecvfd { 


int fd; /* new descriptor */ 
uid t uid; /* effective user ID of sender */ 
gid t gid; /* effective group ID of sender */ 


char fill[(8]; 
E 
recv_fd 读 STREAMS 管 道 直到 接收 到 双 字 节 协 议 的 第 一 个 字 节 (null 字 节 )。 当 发 出 
I RECVFD iocti 命 令 时 ， 位 于 流 首 读 队 列 中 的 下 一 条 消息 应 当 是 一 个 描述 符 ， 它 是 由 
I_SENDFD 发 来 的 ， 或 者 是 一 条 出 错 消息 。 该 函数 示 于 程序 清单 17-13 中 。 


程序 清单 17-13 STREAMS SE recv fai dd 


include "apue.h" 
#include «stropts.h» 


/* 
* Receive a file descriptor from another process (a server). 
* In addition, any data received from the server is passed 
* to (*userfunc) (STDERR FILENO, buf, nbytes). We have a 
* 2-byte protocol for receiving the fd from send fd(). 
*f 
int 
recv fd(int fd, ssize t (*userfunc) (int, const void *, size t)) 


{ 


int newfd, nread, flag, status; 
char *ptr; 

char buf [MAXLINE] ; 

struct strbuf dat; 

struct strrecvfd recvfd; 

status = -1; 

for (; ; ) { 


dat.buf = buf; 

dat.maxlen = MAXLINE; 

flag = 0; 

if (getmsg(fd, NULL, &dat, &flag) « 0) 
err syS("getmsg error"); 

nread - dat.len; 


if (nread == 0) ( 
err ret("connection closed by server"); 
return(-1); 

} 

/* 
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See if this is the final data with null & status. 


* Null must be next to last byte of buffer, status 
* byte is last byte. Zero status means there must 
* be a file descriptor to receive. 

*/ 


for (ptr = buf; ptr < &buf[nread]; ) { 


if (*ptr++ == 0) ( 


if (ptr != &buf [nread-1]) 
err dump ("message format error"); 
status = *ptr & OxFF; 


if (status == 0) ( 


/* prevent sign extension */ 


if (ioctl(fd, I RECVFD, &recvfd) < 0) 


return(-1); 


newfd = recvfd.fd; 


} else { 


newfd = -status; 


} 


nread -= 2; 
} 
} 


if (nread > 0) 


/* new descriptor */ 


if ((*userfunc) (STDERR FILENO, buf, nread) != nread) 
return (-1); 
if (status >= 0) /* final data has arrived */ 
return(newfd); /* descriptor, or -status */ 


17.4.2 经 由 UNIX 域 套 接 字 传 送 文 件 描述 符 


为 了 用 UNIX 域 套 接 字 交 换文 件 描 述 符 ， 调 用 senamsg(2) 和 recvmsg(2) 函 数 (16.575). 
这 两 个 函数 的 参数 中 都 有 一 个 指向 msghdaz 结 构 的 指针 ， 该 结构 包含 了 所 有 有 关 收 发 内 容 的 信 


息 。 该 结构 的 定义 大 致 如 下 : 


struct msghdr { 


void *msg_name; 
socklen_t msg namelen; 
Struct iovec *msg iov; 

int msg iovlen; 
void *msg control; 
socklen_t msg_controllen; 
int msg_flags; 


): 


/* 
/* 
/* 
/* 
/* 
/* 
/* 


optional address */ 

address size in bytes */ 

array of I/O buffers */ 

number of elements in array */ 
ancillary data */ 

number of ancillary bytes */ 
flags for received message */ 


其 中 ， 头 两 个 元 素 通 常用 于 在 网 络 连 接 上 发 送 数据 报 文 ， 在 这 里 ， 目 的 地 址 可 以 由 每 个 数 
据 报 文 指定 。 下 面 两 个 元 素 使 我 们 可 以 指定 由 多 个 缓冲 区 构成 的 数组 (BERRE), ， 这 
与 对 readv 和 writev 函 数 ( 见 14.7 节 ) 的 说 明 一 样 。msg_flags 字 段 包 含 了 说 明 所 接收 到 消 


息 的 标志 ， 这 些 标志 摘要 示 于 表 16-9 中 。 


两 个 元 素 处 理 控 制 信息 的 传送 和 接收 。msg_contro1 字 段 指向 cmsghqar (控制 信息 首部 ) 
结构 ，msg_controllen 字 段 包 含 控制 信息 的 字 节 数 。 


struct cmsghdr { 


Socklen t cmsg_len; /* data byte count, including header */ 
int cmsg level; /* originating protocol */ 
int cmsg type; /* protocol-specific type */ 
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/* followed by the actual control message data */ 

为 了 发 送 文件 描述 符 ， 将 cmsg_len 设 置 为 cmsghar 结 构 的 长 度 加 一 个 整 型 ( 摘 述 符 ) 的 
长 度 ，cmsg_level 字 有 段 设置 为 SOL_SOCKET，cmsg_type 字 段 设置 为 SCM_RIGHTS， 用 以 
指明 我 们 在 传送 访问 权 。(SCM 指 的 是 套 接 字 级 控制 消息 ，socket_level control message。) 访问 
权 仅 能 通过 UNIX 域 套 接 字 传送 。 描 述 符 紧 随 cmsg_type 字 段 之 后 存放 ， 用 CMSG_DATA 宏 获 
得 该 整 型 量 的 指针 。 

三 个 宏 用 于 访问 控制 数据 ， 一 个 安 用 于 帮助 计算 cmsg_1en 所 使 用 的 值 。 

#include «sys/socket.h» 

unsigned char *CMSG DATA(struct cmsghdr *cp); 

返回 值 : 指向 与 cmsghar 结 构 相 关联 的 数据 的 指针 
struct cmsghdr *CMSG FIRSTHDR(struct msghdr *mp) ; 


返回 值 ， 指 向 与 msghar 结 构 相关 联 的 第 一 个 cmsghar 结 构 的 指针 ， 若 无 这 样 的 结构 则 返回 NULL 


struct cmsghdr *CMSG_NXTHDR(struct msghdr *mp, 
struct cmsghdr *cp); 
返回 值 : 指向 与 nsghdr 结 构 相 关联 的 下 一 个 cmsghar 结 构 的 指针 ， 该 msghdqr 结 构 给 出 了 
当前 cmsghar 结 构 ， 若 当前 cmsghar 结 构 已 是 最 后 一 个 则 返回 NULL 


unsigned int CMSG LEN (unsigned int nbytes); 


返回 值 : 为 nbyres 大 小 的 数据 对 象 分 配 的 长 度 





Single UNIX 规 范 定义 了 前 三 个 宏 ， 但 没有 定义 CMSG_LEN。 


CMSG_LEN 宏 返回 为 存放 长 度 为 nbytes 的 数据 对 象 所 需 的 字 节 数 。 它 先 将 nbytes 加 上 
cmsghdr 结 构 的 长 度 ， 然 后 按 处 理 机 体系 结构 的 对 齐 要 求 进行 调整 ， 最 后 再 向 上 取 整 。 
程序 清单 17-14 是 UNIX 域 套 接 字 的 sendG_fd 函 数 。 


程序 清单 17-14 UNIX 域 套 接 字 的 seng_ fa 函数 


#include "apue.h" 
#include «sys/socket.h» 


/* size of control buffer to send/recv one file descriptor */ 
#define CONTROLLEN CMSG LEN (sizeof (int) ) 


static struct cmsghdr *cmptr = NULL; /* malloc'ed first time */ 


/* 

* Pass a file descriptor to another process. 

* If fd«0, then -fd is sent back instead as the error status. 
zr 

int 

send fd(int fd, int fd to send) 


{ 


struct iovec iov[1]; 
struct msghdr msg; 
char buf [2]; /* send fd()/recv fd() 2-byte protocol */ 


iov[0].iov base - buf; 
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iov[0].iov len = 2; 
msg.msg_iov = iov; 
msg.msg iovlen = 1; 
msg.msg name = NULL; 


msg.msg namelen = 0; 
if (fd to send « 0) ( 


msg.msg control = NULL; 
msg.msg controllen - 0; 
buf[1] = -fd to send; /* nonzero status means error */ 
if (buf[1] == 0) 
buf[1] = 1; /* -256, etc. would screw up protocol */ 
) eise { 
if (cmptr == NULL && (cmptr = malloc(CONTROLLEN)) == NULL) 


return(-1); 
cmptr-»cmsg level = SOL SOCKET; 
cmptr-»cmsg type = SCM RIGHTS; 
cmptr-»cmsg len - CONTROLLEN; 
msg.msg control - Omptr; 
msg.msg controllen - CONTROLLEN; 
*(int *)CMSG DATA(cmptr) = fd to send; /* the fd to pass */ 
buf[1] = 0; /* zero status means OK */ 
} 
buf [0] = 0; /* null byte flag to recv fd() */ 
if (sendmsg(fd, &msg, 0) !- 2) 
return(-1); 
return (0); 


} 


在 sendmsg 调 用 中 ， 发 送 双 字 节 协议 数据 (null 和 status 字 节 ) 和 描述 符 。 

为 了 接收 文件 描述 符 (程序 清单 17-15), 我 们 为 cmsghdr 结 构 和 描述 符 分 配 足 够 大 的 空间 ， 
将 msg_control 指 向 该 存储 空间 ， 然 后 调用 recvmsg。 我 们 使 用 CMSG_LEN 宏 计算 所 需 空间 
的 总 量 。 

我 们 从 UNIX 域 套 接 字 读 入 ， 直 至 读 到 null 字 节 ， 它 位 于 最 后 的 status 字 节 之 前 。nnll 字 节 之 
前 是 一 条 来 自发 送 者 的 出 错 消 息 。 这 示 于 程序 清单 17-15 中 。 


程序 清单 17-15 UNIX 域 套 接 字 的 recv_fda 函 数 


#include "apue .hn 
#include «Sys/socket.h» /* struct msghdr */ 


/* size of control buffer to send/recv one file descriptor */ 
#define CONTROLLEN  CMSG LEN (sizeof (int) ) 


static struct cmsghdr *cmptr = NULL; /* malloc'ed first time */ 


/* 
* Receive a file descriptor from a server process. Also, any data 
* received is passed to (*userfunc) (STDERR FILENO, buf, nbytes). 
* We have a 2-byte protocol for receiving the fd from send fd(). 
*/ 

int 

recv fd(int fd, seize t (*userfunc) (int, const void *, size t)) 


{ 


int newfd, nr, status; 
char *ptr; 

char buf [MAXLINE] ; 
struct iovec iov[1}; 


struct msghdr msg; 
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status = -1; 

fors 0 e EN 
iov[0].iov base - buf; 
iov[0].iov len = sizeof (buf); 
msg.msg iov - iov; 
msg.msg iovlen - 1; 
msg.msg name = NULL 
msg.msg namelen - 0; 


if (cmptr == NULL && (cmptr = malloc(CONTROLLEN)) == NULL) 
return(-1); 
msg.msg control cmptr; 
msg.msg controllen CONTROLLEN; 
if ((nr = recvmsg(fd, &msg, 0)) < 0) { 
err sys("recvmsg error"); 
) else if (nr == 0) { 
err_ret ("connection closed by server"); 
return(-1) ; 


} 


/* 
* See if this is the final data with null & status. Null 
* is next to last byte of buffer; status byte is last byte. 
* Zero status means there is a file descriptor to receive. 
cH 
for (ptr = buf; ptr « &buf[nr]; ) { 
if (*ptr++ == 0) { 
if (ptr !- &buf[nr-1]) 
err dump("message format error"); 
Status - *ptr & OxFF; /* prevent sign extension */ 
if (status == 0) { 
if (msg.msg controllen !- CONTROLLEN) 
err dump("status - 0 but no fd"); 
newfd = *(int *)CMSG DATA(cmptr); 


} eise f 
newfd - -status; 
} 
nr -= 2; 
} 
} 
if (nr > 0 && (*userfunc) (STDERR_FILENO, buf, nr) != nr) 
return (-1); 
if (status >= 0) /* final data has arrived */ 
return(newfd); /* descriptor, or -status */ 


} 


注意 ， 该 程序 总 是 准备 接收 一 描述 符 (在 每 次 调用 recvmsg 之 前 ,设置 msg_control 和 
msg controllen), 但 是 仅 当 在 返回 时 ，msg_controllen 非 0， 才 确实 接收 到 一 描述 符 。 

在 传送 文件 描述 符 方 面 ，UNIX 域 套 接 字 和 STREAMS 管 道 之 间 的 一 个 区 别 是 ， 用 
STREAMS 管 道 时 我 们 得 到 发 送 进程 的 身份 。 某 些 UNIX 域 套 接 字 版 本 提供 类 似 的 功能 ， 但 它们 
的 接口 不 同 。 


FreeBSD 5.2.1 和 Linux 2.4.22 % 4 ZUNDGA SEF | Rik GIL, CKMA AE E], Mac OS 10.3 是 
部 分 地 从 FreeBSD 派 生出 来 的 ， 但 禁止 传送 凭证 。Solaris 9 不 支持 在 UNIX 域 套 接 字 上 传送 凭证 。 


在 FreeBSD， 将 凭证 作为 cmsgcred 结 构 传 送 。 
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#define CMGROUP_MAX 16 


struct cmsgcred [ 


pid t cmcred pid; /* sender's process ID */ 
uid t cmcred uid; /* sender's real UID */ 
uid t cmcred euid; /* sender's effective UID */ 
gid t  cmcred gid; /* sender's real GID */ 
Short cmcred ngroups; /* number of groups */ 


gid t  cmcred groups[CMGROUP MAX]; /* groups */ 
}; 
当 传送 凭证 时 ， 仅 需 为 cmsgcred 结 构 保 留存 储 空 间 。 内 核 将 填充 该 结构 以 防止 应 用 程序 
伪装 成 具有 另 一 种 身份 。 
在 Linux 中 ， 将 凭证 作为 ucred 结 构 传 送 。 


struct ucred { 
uint32 t pid; /* sender's process ID */ 
uint32 t uid; /* sender's user ID */ 
uint32 t gid; /* sender’s group ID */ 


h | 
不 同 于 FreeBSD 的 是 ，Linux 要 求 在 传送 前 先 将 结构 初始 化 。 内 核 将 确保 应 用 程序 使 用 对 应 


于 调用 程序 的 值 ， 或 具有 适当 的 权限 使 用 其 他 值 。 
程序 清单 17-16 显 示 了 更 新 后 的 send_fd 函 数 ， 它 包含 了 传送 进程 的 凭证 。 


程序 清单 17-16 在 UNIX 域 套 接 字 上 发 送 凭证 


#include "apue .hn 
#include <sys/socket .h> 


#if defined (SCM CREDS) /* BSD interface */ 
#define CREDSTRUCT cmsgcred 

#define SCM CREDTYPE SCM CREDS 

#elif defined(SCM CREDENTIALS)  /* Linux interface */ 


#define CREDSTRUCT ucred 

#define SCM CREDTYPE SCM_CREDENTIALS 
#else 

#error passing credentials is unsupported! 
#endif 


/* size of control buffer to send/recv one file descriptor */ 
#define RIGHTSLEN CMSG LEN (sizeof (int) ) 

#define CREDSLEN CMSG_LEN (sizeof (struct CREDSTRUCT) ) 
#define CONTROLLEN (RIGHTSLEN + CREDSLEN) 


static struct cmsghdr ‘*cmptr = NULL; /* malloc'ed first time */ 
/* 

* Pass a file descriptor to another process. 

* If fd«0, then -fd is sent back instead as the error status. 

*/ 

int 

send fd(int fd, int fd to send) 


{ 


struct CREDSTRUCT *credp; 


struct cmsghdr *cmp; 

struct iovec iov{1]; 

struct msghdr msg; 

char buf [2]; /* send fd/recv ufd 2-byte protocol */ 
iov[0].iov_base = buf; 

iov[0l.iov len = 2; 
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msg.msg_iov = lov; 
msg.msg iovlen 
msg.msg name 
msg.msg namelen = 
meg.msg flags = 0; 
if (fd to send « 0) { 

msg.msg control NULL; 

msg.msg controllen = 0; 


"o 
go 
Et 

a 
- 
an 


0; 


buf [1] = -fd to send; /* nonzero status means error */ 

if (buf[1] == 0) 
buf[1] = 1; /* -256, etc. would screw up protocol */ 

} else { 

if (cmptr == NULL && (cmptr = malloc (CONTROLLEN)) == NULL) 
return (-1); 

msg.msg_control = cmptr; 

meg.msg_controllen = CONTROLLEN; 


cmp = cmptr; 
cmp->cmsg level = SOL SOCKET; 


cmp->cmsg_type = SCM_RIGHTS; 
cmp->cmsg_len = RIGHTSLEN; 
*(int *)CMSG DATA(cmp) = fd to send; /* the fd to pass */ 


cmp = CMSG NXTHDR(&msg, cmp); 

cmp-»cmsg level = SOL SOCKET; 

Ccmp-»cmsg type SCM_CREDTYPE; 

cmp->cmsg_len = CREDSLEN; 

credp = (struct CREDSTRUCT *)CMSG DATA(cmp) ; 
Hif defined(SCM CREDENTIALS) 

credp-»uid - geteuid(); 


credp->gid = getegid(); 
credp->pid = getpid(); 
#endif 
buf [1] = 0; /* zero status means OK */ 
} 
buf [0] = 0; /* null byte flag to recv_ufd() */ 


if (sendmsg(fd, &msg, 0) != 2) 
return (-1); 
return (0); 


注意 ， 只 是 在 Linux 上 才 需 要 初始 化 凭证 结构 。 - ; 
程序 清单 17-17 中 的 recv_ufa 函 数 是 recv_fd 的 修改 版 ， 它 通过 一 引用 参数 返回 发 送 者 
的 用 户 ID。 
程序 清单 17-17 在 UNIX 域 赛 接 字 上 接收 凭证 


#include "apue.h" 
#include «sys/socket.h» /* struct msghdr */ 
#include «sys/un.h» 


#if defined(SCM CREDS) /* BSD interface */ 

define CREDSTRUCT cmsgcred 

#define CR UID cmcred uid 

#define CREDOPT LOCAL PEERCRED 612 


Hdefine SCM CREDTYPE SCM CREDS 
#elif defined(SCM CREDENTIALS) /* Linux interface */ 


#define CREDSTRUCT ucred 
#define CR UID uid 
#define CREDOPT SO_PASSCRED 


#define SCM_CREDTYPE SCM_CREDENTIALS 
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#else 
#error passing credentials is unsupported! 
#endif 


/* size of control buffer to send/recv one file descriptor */ 
#define RIGHTSLEN CMSG LEN (sizeof (int) ) 
#define CREDSLEN CMSG LEN (sizeof (struct CREDSTRUCT)) 
#define CONTROLLEN  (RIGHTSLEN + CREDSLEN) 
static struct cmsghdr *cmptr = NULL; /* malloc'ed first time */ 
/* 
* Receive a file descriptor from a server process. Also, any data 
* received is passed to (*userfunc) (STDERR FILENO, buf, nbytes). 
* We have a 2-byte protocol for receiving the fd from send fd(). 
*/ 
int 
recv ufd(int fd, uid t *uidptr, 
ssize_t (*userfunc) (int, const void *, size t)) 
{ 


struct cmsghdr *cmp; 

struct CREDSTRUCT *credp; 

int newfd, nr, status; 
char *ptr; 

char buf [MAXLINE]; 
struct iovec iov[11l; 

struct msghdr msg; 

const int on = 1; 

status = -1; 

“newfd = -1; 


if (setsockopt (fd, SOL SOCKET, CREDOPT, &on, sizeof(int)) « 0) { 
err ret("setsoCkopt failed"); 
return(-1); 


for (; : 0) 
iov[0].iov base - buf; 
iov[0].iov len = sizeof (buf); 
msg.msg iov z iov; 
msg.msg iovlen = 1; 
msg.msg name z NULL; 
msg.msg namelen = 0; 
if (cmptr == NULL && (cmptr = malloc(CONTROLLEN)) == NULL) 
return(-1); 
msg.msg control = cmptr; 


msg.msg_controllen = CONTROLLEN; 

if ((nr = recvmsg(fd, &msg, 0)) < 0) { 
err sys("recvmsg error"); 

} else if (nr == 0) { 
err_ret ("connection closed by server") ; 
return (-1); 


} 
/* 
* See if this is the final data with null & status. Null 
* is next to last byte of buffer; status byte is last byte. 
* Zero status means there is a file descriptor to receive. 
*/ 
for (ptr = buf; ptr < &buf[nr]; ) { 
if (*ptr++ == 0) { 
if (ptr != &buf[nr-11]) 
err dump("message format error"); 
status = *ptr & OxFF; /* prevent sign extension */ 
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if (status == 0) { 
if (msg.msg controllen != CONTROLLEN) 
err dump("status = 0 but no fd"); 


/* process the control data */ 
for (cmp = CMSG FIRSTHDR (&msg); 
cmp !- NULL; cmp - CMSG NXTHDR(&msg, cmp)) ( 
if (cmp-»cmsg level !- SOL SOCKET) 
continue; 
switch (cmp-»cmsg type) { 
case SCM RIGHTS: 
newfd = *(int *)CMSG DATA(cmp); 
break; 
case SCM CREDTYPE: 
credp = (struct CREDSTRUCT *)CMSG_DATA(cmp) ; 
*uidptr = credp->CR_UID; 


} else { 
newfd = -status; 
nr -= 2; 
} 
if (nr > 0 && (*userfunc) (STDERR_FILENO, buf, nr) != nr) 
return(-1); 
if (status >= 0) /* final data has arrived */ 
return(newfd); /* descriptor, or -status */ 


) 
) 


在 FreeBSD 上 ， 我 们 指定 SCM_CREDS 来 传送 凭证， 在 Linux 上 Wie FRJjSCM CREDENTIALS, 


17.5 _ open 服务 器 版 本 1 


使 用 文件 描述 符 传送 技术 ， 我 们 开发 了 一 个 open 服 务 器 : 一 个 由 一 个 进程 执行 以 打开 一 个 
或 几 个 文件 的 程序 。 该 服务 器 不 是 将 文件 内 容 送 回调 用 进程 ， 而 是 送 回 一 个 打开 文件 描述 符 。 
这 使 该 服务 器 对 任何 类 型 的 文件 〈 例 如 一 个 设备 或 套 接 字 ) 而 不 单 是 普通 文件 都 能 起 作用 。 这 
也 意味 着 ， 用 IPC 交 换 了 最 小 量 的 信息 一 一 从 客户 进程 到 服务 器 进程 传送 文件 名 和 打开 模式 ， 
而 从 服务 器 进程 到 客户 进程 返回 描述 符 。 文 件 内 容 不 需 用 IPC 传 送 。 

将 服务 器 设计 成 一 个 单独 的 可 执行 程序 (或 者 是 由 客户 进程 执行 的 ， 如 本 节 所 述 ， 或 者 是 
一 个 守护 服务 器 ， 我 们 将 在 下 一 节 开 发 )， 有 很 多 优点 : 

* 任 一 客户 进程 都 易于 和 服务 器 进程 联系 ， 这 类 似 于 客户 进程 调用 一 库 函 数 。 不 需要 将 一 

特定 服务 硬 编码 到 应 用 程序 中 ， 而 是 设计 一 种 可 供 重用 的 设施 。 

“如若 需 要 更 改 服务 器 ， 那 么 也 只 影响 一 个 程序 。 相 反 ， 更 新 一 库 函 数 可 能 要 更 改 调 用 此 

库 函 数 的 所 有 程序 (用 连 编程 序 重新 连接 )。 共 享 库 函 数 可 以 简化 这 种 更 新 (7.7 节 )。 

“服务 器 可 以 是 设置 用 户 ID 程 序 ， 于 是 使 其 具有 客户 进程 没有 的 附加 权限 。 注 意 ， 一 个 库 

函数 (或 共享 库 函 数 ) 不 能 提供 这 种 能 力 。 

客户 进程 创建 一 个 s 管 道 (或 者 是 一 个 基于 STREAMS 的 管道 ， 或 者 是 UNIX 域 套 接 字 对 )， 
然后 调用 fork 和 exec 以 调用 服务 器 进程 。 客 户 进程 经 s 管 道 发 送 请 求 ， 服 务 器 进程 经 s 管 道 回 
送 响应 。 
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定义 客户 进程 和 服务 器 进程 间 的 应 用 程序 协议 如 下 ; 

(1) 客户 进程 通过 s 管 道 向 服务 器 进程 发 送 “open <pathname> <openmode>\0” 形 式 的 请 
求 ，<openmode> 是 open 函数 的 第 二 个 参数 ， 以 ASCIH 十 进 制 数 表 示 。 该 请 求 字 符 串 以 null 字 节 
结尾 。 

(2) 服务 器 进程 调用 send_fq 或 senaq_err 回 送 一 打开 描述 符 或 一 条 出 错 消息 。 

下 面 是 一 个 进程 向 其 父 进程 发 送 一 打开 描述 符 的 实例 。17.6 节 将 修改 此 实例 ， 使 其 使 用 一 
个 守护 服务 器 进程 ， 它 将 一 个 描述 符 发 送 给 一 个 完全 无 关 的 进程 。 

程序 清单 17-18 是 头 文件 open .h， 它 包括 标准 头 文件 ， 并 且 定 勾 了 各 个 函数 原型 。 


程序 清单 17-18 cpen.h 头 文件 


#include "apue.h" 
#include <errno.h> 


#define CL_OPEN "open" /* client's request for server */ 


int csopen(char *, int); 


程序 清单 17-19 是 main 函 数 ， 其 中 包含 一 个 循环 ， 它 先 从 标准 输入 读 一 个 路 径 名 ， 然 后 将 
该 文件 复制 至 标准 输出 。 它 调用 csopen 以 与 open 服 务 器 进程 联系 ， 从 其 返回 一 个 打开 描述 符 。 


程序 清单 17-19 客户 进程 mnain 函 数 版 本 1 


#include "open.h" 
#include «£cntl.h» 


#define BUFFSIZE 8192 


int 
main(int argc, char *argv[]) 
{ 
int n, fd; 
char buf [BUFFSIZE], line [MAXLINE] ; 


/* read filename to cat from stdin */ 


while (fgets(line, MAXLINE, stdin) != NULL) { 
if (line[strlen(line) - 1] == 'WMn') 
line[strlen(line) - 1] = 0; /* replace newline with null */ 


/* open the file */ 
if ((fd = csopen(line, O RDONLY)) < 0) 
continue; /* csopen() prints error from server */ 


/* and cat to stdout */ 
while ((n = read(fd, buf, BUFFSIZE)) > 0) 
if (write(STDOUT FILENO, buf, n) !- n) 
err Bys ("write error"); 
if (n « O) 
err sys("read error"); 
close(fd); 


exit(0); 


) 


程序 清单 17-20 是 函数 csopen， 它 先 创建 一 个 s 管 道 ， 然 后 进行 服务 器 进程 的 Eork 和 exec 
操作 。 
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程序 清单 17-20 ”ceocpen 函 数 版 本 1 


#include "open.h" 
#include «gys/uio.h» /* struct iovec */ 
/* 


* Open the file by sending the "name" and "oflag" to the 
* connection server and reading a file descriptor back. 
*/ 

int 

csopen(char *name, int oflag) 


pid t pid; 


int len; 

char buf [101 ; 

Struct iovec iov [31]; 

static int fd[2] = { -1, -1 }; 


if (fd[ol < 0) { /* fork/exec our open server first time */ 
if (s pipe(fd) « 0) 
err sys("s pipe error"); 
if ((pid = fork()) « 0) ( 
err sys("fork error"); 
} else if (pid == 0) { /* child */ 
close (fd[0]); 
if (fd[1] = STDIN FILENO && 
dup2(fd[1], STDIN FILENO) !- STDIN FILENO) 
err sys("dup2 error to stdin"); 
if (fd[1] !- STDOUT FILENO && 
dup2(fd[1], STDOUT FILENO) !- STDOUT FILENO) 
err sys("dup2 error to stdout"); 
if (execl("./opend", "opend", (char *)0) « 0) 
err sys("execl error"); 
) 
close(fd[1]); /* parent */ 
) 
sprintf (buf, " $d", oflag); /* oflag to ascii */ 
iov[0].iov_base = CL_OPEN " "; /* string concatenation */ 
iov[0].iov len strlen(CL OPEN) + 1; i 
iov[1] .iov_base = name; 
iov(11.iov len Strlen (name); 
iov[2].iov base - buf; 
iov[2].iov len strlen(buf) + 1; /* +1 for null at end of buf */ 
len = iov[0].iov len + iov[1].iov len + iov[2].iov len; 
if (writev(fd[0}, &iov[0], 3) != len) 
err_sys("writev error"); 


/* read descriptor, returned errors handled by write() */ 
return(recv fd(fd[0], write)); 


) 


子 进程 关闭 管道 的 一 端 ， 父 进程 关闭 另 一 端 。 作 为 服务 器 进程 ， 子 进程 也 将 管道 的 一 端 复 
制 到 其 标准 输入 和 标准 输出 。( 另 一 种 备 选 方案 是 将 描述 符 fa[11 的 ASCH 表 示 形 式 作为 一 个 参 
数 传送 给 服务 器 进程 。) 

父 进程 将 请 求 发 送 给 服务 器 进程 ， 请 求 中 包含 路 径 名 和 打开 模式 。 最 后 ， 父 进程 调用 
recv_fq 返 回 描 述 符 或 错误 消息 。 如 果 服 务 器 进程 返回 一 错误 消息 ,那么 ， 父 进程 调用 write， 
向 标准 出 错 输出 该 消息 。 

现在 ， 观 察 open 服 务 器 进程 。 其 程序 是 copend， 它 由 子 进程 执行 ( 见 程 序 清单 17-20)。 先 


ee 





618 
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观察 opena .h 头 文件 ( 见 程 序 清单 17-21) ， 它 包括 了 标准 头 文件 ， 并 且 声 明了 全 局 变量 和 函数 
原型 。 


程序 清单 17-21 opend.h 头 文件 版 本 1 





#include "apue.h" 
#include <errno.h> 


#define CL_OPEN "open" /* client's request for server */ 


extern char errmsg[]; /* error message string to return to client */ 
extern int oflag; /* open() flag: O xxx ... */ 
extern char *pathname; /* of file to open() for client */ 


int cli args(int, char **); 
void request (char *, int, int); 


main 函 数 (程序 清单 17-22) 经 s 管 道 ( 它 的 标准 输入 ) 读 来 自 客户 进程 的 请 求 ， 然 后 调用 
EX request, 





程序 清单 17-22 服务 器 进程 main 函 数 版 本 1 


#include "opend.h" 
char errmsg [MAXLINE] ; 
int oflag; 

char *pathname ; 

int 


main (void) 


int nread; 
char buf [MAXLINE] ; 


for (; ;) { /* read arg buffer from client, process request */ 
if ((nread = read(STDIN FILENO, buf, MAXLINE)) < 0) 
err_sys("read error on stream pipe"); 
else if (nread == 0) 
break; /* client has closed the stream pipe */ 
request (buf, nread, STDOUT FILENO); 
) 
exit (0); 


} 





程序 清单 17-23 中 的 request 函 数 承 担 了 全 部 工作 。 它 调用 函数 buf_args 将 客户 进程 请 
求 分 解 成 标准 argv 型 的 参数 表 , 然后 调用 函数 c11_args 处 理 客户 进程 的 参数 。 如 果 一 切 正常 ， 
则 调用 open 打 开 相 应 文件 ， 接 着 调用 send_fa， 经 由 s 管 道 〈 它 的 标准 输出 ) 将 描述 符 回 送 给 
客户 进程 。 如 果 出 错 则 调用 send_err 回 送 一 则 出 错 消 息 ， 其 中 使 用 了 前 面 说 明 的 客户 进程 一 
服务 器 进程 协议 。 


程序 清单 17-23 request 函数 版 本 1 


#include "opend.h" 
#include «fcntl.h» 
void 


request(char *buf, int nread, int fd) 


{ 


int newfd; 
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if (buf[nread-1] != 0) { 
sprintf (errmsg, "request not null terminated: %*.*s\n", 
nread, nread, buf); 
send_err(fd, -1, errmsg); 
return; 
} 
if (buf args(buf, cli args) < 0) ( /* parse args & set options */ 
send err(fd, -1, errmsg); 
return; ] 


if ((newfd - open(pathname, oflag)) « O) ( 
sprintf (errmsg, "can't open %s: %s\n", pathname, 
strerror (errno) ) ; 
send_err(fd, -1, errmsg); 


return; 

} 

if (send fd(fd, newfd) « 0) /* send the descriptor */ 
err sys("send fd error"); 

close (newfd) ; /* we're done with descriptor */ 





客户 进程 请 求 是 一 个 以 nu 结尾 的 字符 串 ， 它 所 包含 的 各 参数 由 空格 分 隔 。 程 序 清单 17-24 
中 的 buf_args 函 数 将 字符 申 分 解 成 标准 argv 型 参数 表 ， 并 调用 用 户 函 数 处 理 参 数 。 本 节 稍 后 
将 用 到 该 函数 。 我 们 使 用 ISO C 函 数 strtok 将 字符 申 分 割 成 参数 。 


程序 清单 17-24 buf_args 函 数 





#include "apue.h" 


#define MAXARGC 50 /* max number of arguments in buf */ 
#define WHITE "\t\n" /* white space for tokenizing arguments */ 


int 


buf[] contains white-space-separated arguments. We convert it to an 
argv-style array of pointers, and call the user's function (optfunc) 
to process the array. We return -1 if there's a problem parsing buf, 
else we return whatever optfunc() returns. Note that user's buf[] 
array is modified (nulls placed after each token). 


buf args(char *buf, int (*optfunc) (int, char **)) 


char *ptr, *argv[MAXARGC]; 
int argc; 


if (strtok(buf, WHITE) == NULL) /* an argv[0] is required */ 
return (-1); 
argv [argc = 0] = buf; 
while ((ptr = strtok(NULL, WHITE)) != NULL) { 
if (++argc >= MAXARGC-1) /* -1 for room for NULL at end */ 
return (-1); 
argv[argc] = ptr; 


argv [++argc] = NULL; 
/* 


* Since argv[] pointers point into the user's buf[], 
* user's function can just copy the pointers, even 
* though argv[] array will disappear on return. 


*/ 
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return((*optfunc) (argc, argv)); 





buf_args 调 用 的 服务 器 函数 是 cl1i_args ( 见 程序 清单 17-25) 。 它 验证 客户 进程 发 送 的 
参数 个 数 是 否 正确 ， 然 后 将 路 径 名 和 打开 模式 存放 在 全 局 变量 中 。 


程序 清单 17-25 cli_argsK 


#include "opend.h" 
/* 
* This function is called by buf_args(), which is called by 
* request(). buf args() has broken up the client's buffer 
* into an argv[]-style array, which we now process. 
*/ 
int 


cli_args(int argc, char **argv) 


if (argc !- 3 || strcmp(argv[0], CL OPEN) != 0) ( 
strcpy (errmsg, "usage: «pathname» <oflag>\n"); 
return (-1); 
} 
pathname = argv[i]; /* save ptr to pathname to open */ 
oflag = atoi(argv(2]); 
return (0); 


} 


这 样 由 客户 进程 执行 fork 和 exec 而 调用 的 open 服 务 器 就 完成 了 。 在 fork 之 前 创建 了 一 个 
s 管 道 ， 然 后 客户 进程 和 服务 器 进程 用 它 进行 通信 。 在 这 种 安排 下 ， 每 个 客户 进程 都 有 一 服务 
器 进程 。 


17.6 open 服 务 器 版 本 2 


在 上 一 节 中 ， 我 们 开发 了 一 个 open 服 务 器 ， 客 户 进程 调用 fork 和 exec 来 调用 该 服务 器 ， 
它 演示 了 如 何 从 子 进程 向 父 进程 传送 文件 描述 符 。 本 节 将 开发 一 个 以 守护 进程 方式 运行 的 open 
服务 器 。 用 一 个 服务 器 进程 处 理 所 有 客户 进程 的 请 求 。 这 一 设计 应 该 更 加 有 效 ， 因 为 没有 使 用 
fork 和 exec。 在 客户 进程 和 服务 器 进程 之 间 仍 使 用 s 管 道 ， 来 演示 在 无 关 进 程 之 间 如 何 传送 文 
件 描 述 符 。 我 们 仍 将 使 用 17.2.2 节 说 明 的 三 个 函数 ， serv listen, serv, accepti 
cli_conn。 这 一 服务 器 还 将 展示 了 一 个 服务 器 进程 如 何 向 多 个 客户 进程 提供 服务 ， 其 中 使 用 
了 14.5 节 中 介绍 过 的 select 和 poll1 函 数 。 

本 市 所 述 的 客户 进程 类 似 于 17.5 节 。 确实, 文件 main . c 是 完全 相同 的 〈 见 程序 清单 17-19) 。 
在 open .h 头 文件 ( 见 程 序 清单 17-18) 中 则 加 了 下 面 一 行 : 

#define CS_OPEN "/home/sar/opend" /* server's well-known name */ 
因为 在 这 里 调用 的 是 c1 1i_conn 而 非 tork 和 exec， 所 以 文件 cpen . c 与 程序 清单 17-20 中 的 不 
同 。 这 示 于 程序 清单 17-26 中 。 


程序 清单 17-26 ceocpen 函 数 第 2 版 





#include "open .hn 
#include <sys/uio.h> /* struct iovec */ 
/* 
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* Open the file by sending the "name" and "oflag" to the 
* connection server and reading a file descriptor back. 
*/ 

int : 

csopen(char *name, int oflag) 


{ 


int len; 

char buf (101; 

struct iovec iov[31; 

static int csfd = -1; 

if (csfd < 0) { /* open connection to conn server */ 


if ((csfd = cli conn(C8 OPEN)) < 0) 
err sys("cli conn error"); 


) 


sprintf (buf, " $d", oflag); /* oflag to ascii */ 
iov[0].iov base = CL OPEN " "; /* string concatenation */ 
iov[0].iov len = strlen(CL OPEN) + 1; 

iov[1].iov base = name; 

iov[1].iov len = strlen (name); 

iov[2].iov base = buf; 

iov[2].iov len = strlen(buf) + 1; /* null always sent */ 
len = iov[0l.iov len + iov[1].iov len + iov[2].iov len; 

if (writev(csfd, &iov[0]1, 3) != len) 


err_sys("writev error"); 


/* read back descriptor; returned errors handled by write() */ 
return(recv fd(csfd, write)); 


从 客户 进程 到 服务 器 进程 所 使 用 的 协议 仍然 相同 。 
我 们 再 来 看 服务 器 进程 。 头 文件 openG .hn ( 见 程序 清单 17-27) 包括 了 标准 头 文件 ， 并 且 
声明 了 全 局 变量 和 函数 原型 。 


程序 清单 17-27 open.h 头 文件 版 本 2 


#include "apue.h" 
#include <errno.h> 


#define CS OPEN "/home/sar/opend" /* well-known name */ 


#define CL_OPEN "open" /* client's request for server */ 
extern int debug; /* nonzero if interactive (not daemon) */ 
extern char errmsg[]; /* error message string to return to client */ 
extern int oflag; /* open flag: O xxx ... */ 
extern char *pathname; /* of file to open for client */ 
typedef struct { /* one Client struct per connected client */ 
int fd; /* fd, or -1 if available */ 
uid t uid; 
} Client; 
extern Client *client; /* ptr to malloc’ed array */ 
extern int client_size; /* # entries in client[] array */ 
int cli args(int, char **); 
int client add(int, uid t); 
void client del(int); 
void loop (void); 
void request (char *, int, int, uid t); 
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因为 此 服务 器 进程 处 理 所 有 客户 进程 ， 所 以 它 必 须 保存 每 个 客户 进程 连接 的 状态 。 这 是 用 
openqd.h 头 文件 中 声明 的 client 数 组 实现 的 。 程 序 清单 17-28 定 义 了 三 个 操纵 此 数组 的 函数 。 


程序 清单 17-28 操纵 client 数 组 的 三 个 函数 


#include "opend.h" 





#define NALLOC 10 /* # client structs to alloc/realloc for */ 


static void 
client alloc (void) /* alloc more entries in the client[] array */ 
{ 
int i; 
if (client == NULL) 
client = malloc(NALLOC * sizeof (Client) ); 
else 
client = realloc(client, (client_size+NALLOC) *sizeof (Client) ); 
if (client == NULL) 
err_sys("can’t alloc for client array"); 


/* initialize the new entries */ 
for (i = client_size; i < client_size + NALLOC; i++) 


client[i].fd = -1; /* fd of -1 means entry available */ 
622 client size «- NALLOC; 
) 
/* 
* Called by loop() when connection request from a new client arrives. 
*/ 
int 
client_add(int fd, uid t uid) 
{ 
int is 
if (client == NULL) /* first time we're called */ 
client alloc(); 
again: 
for (i = 0; i < client size; i++) ( 
if (client{i].fd == -1) { /* find an available entry */ 
client [i].fd = fd; 
client [i] .uid = uid; 
return(i); /* return index in client[] array */ 
} 
} 
/* client array full, time to realloc for more */ 
client_alloc(); 
goto again; /* and search again (will work this time) */ 
} 
/* 
* Called by loop() when we’re done with a client. 
wh 
void 
client_del(int fd) 
{ 
int i; 


for (i = 0; i < client size; i++) { 
if (client [i].fd == fd) { 
client {i] .fd = -1; 
return; 
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} 
} 


log quit ("can’t find client entry for fd &d", fd); 


第 一 次 调用 client_add 时 ， 它 调用 client_alloc，client_alloc 又 调用 malloc 为 
该 数组 的 10 个 登记 项 分 配 空间 。 在 这 10 个 登记 项 全 部 用 完 后 ， 如 若 再 调用 c1ient_ad9， 那 么 
在 client._alloc 函 数 中 将 调用 real1oc， 由 该 函数 分 配 附 加 空间 。 依 靠 这 种 动态 空间 分 配 ， 
我 们 无 需 将 编译 时 client 数 组 的 长 度 限定 为 某 个 估计 值 ， 并 将 该 值 写 入 头 文件 。 如 果 出 错 ， 
那么 因为 假定 服务 器 进程 是 守护 进程 ， 所 以 这 些 函 数 调 用 1og_ 函 数 ( 见 附录 B)。 

mainke ( 见 程序 清单 17-29) 定义 全 局 变量 ， 处 理 命令 行 选项 ， 然 后 调用 1oop 函 数 。 如 
果 以 -Gd 选项 调用 服务 器 进程 ， 则 它 以 交互 方式 运行 而 不 是 守护 进程 。 当 测试 些 服务 器 进程 时 ， 
使 用 交互 运行 方式 。 

程序 清单 17-29 服务 器 进程 main 西 数 版 本 2 


#include "opend.h" 
include <syslog.h> 


int debug, oflag, client size, log to stderr; 
char errmsg [MAXLINE] ; 

char *pathname; 

Client  *client = NULL; 

int 

main(int argc, char *argv[]) 


{ 


int c; 


log open("open.serv", LOG PID, LOG USER); 


opterr - 0; /* don't want getopt() writing to stderr */ 
while ((c - getopt(argc, argv, "d")) !- EOF) ( 
switch (c) ( 
case 'd': /* debug */ 
debug - log to stderr - 1; 
break; 
case '?': 


err_quit ("unrecognized option: -&c", optopt); 
) 
) 


if (debug == 0) 
daemonize ("opend") ; 


loop); /* never returns */ 


) 


loop 函 数 是 服务 器 进程 的 无 限 循 环 。 我 们 将 给 出 该 函数 的 两 种 版 本 。 程 序 清单 17-30 是 使 


用 select 的 一 种 版 本 ， 程 序 清单 17-31 是 使 用 po11 的 另 一 种 版 本 。 
程序 清单 17-30 使 用 select 的 loop 函 数 


#include "opend.h" 
#include <sys/time.h> 
#include «sys/select.h» 
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void 
loop (void) 


{ 


int i, n, maxfd, maxi, listenfd, clifd, nread; 
char buf [MAXLINE]; 

uid t uid; 

fd set rset, allset; 


FD ZERO(&allset); 


/* obtain fd to listen for client requests on */ 
if ((listenfd = serv listen(CS OPEN)) « 0) 
log sys("serv listen error"); 
FD SET(listenfd, &allset); 
maxfd - listenfd; 
maxi - -1; 


for (; : ) { 
rset = allset; /* rset gets modified each time around */ 
if ((n = select (maxfd + 1, &rset, NULL, NULL, NULL)) < 0) 
log sys("select error"); 


if (FD ISSET(listenfd, &rset)) { 

/* accept new client request */ 

if ((clifd = serv accept(listenfd, &uid)) « 0) 
log sys("serv accept error: &d", clifd); 

i = client add(clifd, uid); 

FD SET(clifd, &allset); 

if (clifd » maxfd) 
maxfd = clifd; /* max fd for select() */ 

if (i » maxi) 


maxi = i; /* max index in client[] array */ 
log msg("new connection: uid %d, fd &d", uid, clifd); 
continue; 


for (i = 0; i <= maxi; i++) { /* go through client[] array */ 
if ((clifd = client {i] .fd) < 0) 
continue; 
if (FD ISSET(clifd, &rset)) { 
/* read argument buffer from client */ 
if ((nread = read(clifd, buf, MAXLINE)) < 0) { 
log sys("read error on fd $d", clifd); 
) else if (nread == 0) { 
log_msg("closed: uid £d, fd td", 
client [i] .uid, clifd); 
client_del(clifd); /* client has closed cxn */ 
FD CLR(clifd, &allset); 
close (clifd); 
) eise ( /* process client's request */ 
request(buf, nread, clifd, client[i].uid); 
) 





此 函数 调用 serv_1isten 创 建 服务 器 进程 对 于 客户 进程 连接 的 端点 。 此 函数 的 其 余部 分 
是 一 个 循环 ， 它 从 select 调 用 开始 。 在 select 返 回 后 ， 可 能 发 生 下 列 两 种 情况 ， 
(D 描述 符 1istenfd 可 能 准备 好 读 ， 这 意味 着 新 客户 进程 已 调用 了 c1i_conn。 为 了 处 理 这 
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种 情况 ， 我 们 将 调用 serv_accept， 然 后 为 新 客户 进程 更 新 cl ient 数 组 以 及 相关 的 得 记 消 息 。 
(跟踪 记录 作为 select 第 一 个 参数 的 最 高 描述 符 编号 ， 也 记 下 client 数 组 中 用 到 的 最 大 下 标 。) 

(2) 一 个 现存 的 客户 进程 的 连接 可 能 准备 好 读 。 这 意味 着 该 客户 进程 已 经 终止 ， 或 者 已 经 
发 送 了 一 个 新 请 求 。 如 果 read 返 回 0 (文件 结束 )， 则 可 认为 一 客户 进程 终止 。 如 果 read 返 回 
值 大 于 0 则 可 判定 有 一 新 请 求 等 待 处 理 ， 调 用 request 处 理 此 新 的 客户 进程 请 求 。 

用 a1l1lset 描 述 符 集 跟踪 当前 使 用 的 描述 符 。 当 新 客户 进程 连 至 服务 器 进程 时 ， 此 描述 符 
集 的 某 个 适当 位 被 打开 。 当 该 客户 进程 终止 时 ， 这 个 位 就 被 关闭 。 

因为 客户 进程 的 所 有 描述 符 (包括 与 服务 器 进程 的 连接 ) 都 由 内 核 自 动 关 闭 ， 所 以 我 们 总 
能 知道 什么 时 候 一 客户 进程 终止 ， 该 终止 是 否 自愿 。 这 与 XSI IPC 机 制 不 同 。 

{# Fpo1 1 AY loop BRAT FER IB 17-315, 


程序 清单 17-31 使 用 pol1 的 loop 函数 


#include "opend.h" 

#include «poll.h» 

#if !defined(BSD) && !defined (MACOS) 
#include <stropts.h> 

#endif 


void 
Loop (void) 


int i, maxi, listenfd, clifd, nread; 
char buf [MAXLINE] ; 
uid t uid; 


struct pollfd *pollfd; 


if ((pollfd = malloc(open max() * sizeof(struct pollfd))) == NULL) 
err_sys ("malloc error"); 


/* obtain fd to listen for client requests on */ 

if ((listenfd = serv_listen(CS_OPEN)) < 0) 
log_sys("serv_listen error"); 

client_add(listenfd, 0); /* we use [0] for listenfd */ 

pollfd[0].fd - listenfd; 

pollfd[0].events = POLLIN; 

maxi = O0; 


for (; ;) 
if (poll(pollfd, maxi « 1, -1) « O) 
log sys("poll error"); 


if (pollfd[0].revents & POLLIN) { 
/* accept new client request */ 
if ((clifd = serv accept(listenfd, &uid)) « 0) 
log sys ("serv accept error: %d", clifd); 
i = client add(clifd, uid); 
pollfd[i] .fd = clifd; 
polifd{i] .events = POLLIN; 
if (i > maxi) 
maxi = i; 
log msg("new connection: uid &d, fd &d", uid, clifd); 


for (i = 1; i <= maxi; i++) { 
if ((clifd = client[i].fd) < 0) 
continue; 
if (pollfd{i].revents & POLLHUP) { 
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goto hungup; 
} else if (pollfd[i].revents & POLLIN) { 

/* read argument buffer from client */ 

if ((nread = read(clifd, buf, MAXLINE)) « 0) { 
log sys("read error on fd $d", clifd); 

) eise if (nread == 0) { 

hungup: 
log msg("closed: uid td, fd %d", 
client[i].uid, clifd); 

client del(clifd); /* client has closed conn */ 
pollfd[i].fd - -1; 
close(clifd); 

) eise { /* process client's request */ 
request(buf, nread, clifd, client[i].uid); 

) 


) 
) 
) 
} 


为 使 客户 进程 数量 能 与 打开 描述 符 的 数量 相当 ， 我 们 动态 地 为 po11f£d 结 构 的 数组 分 配 空间 


(参见 程序 清单 2-4 中 的 函数 open_max)。 

client 数 组 中 下 标号 为 0 的 登记 项 用 于 1istenfa 描 述 符 。 于 是 ，c1lient 数 组 中 的 客户 
进程 下 标号 与 po11fq 数 组 中 所 用 的 下 标号 相同 。 新 客户 进程 连接 的 到 达 由 1istenfq 描 述 符 
中 的 POLLIN 指 示 。 如 同 前 述 ， 调 用 serv_accept 以 接收 该 连接 。 

对 于 一 个 现存 的 客户 进程 ， 我 们 应 当 处 理 来 自 po11 的 两 个 不 同事 件 : 由 POLLHUP 指 示 的 
客户 进程 终止 ， 由 POLLIN 指 示 的 来 自 现存 客 户 进程 的 一 个 新 请 求 。 回 忆 习 题 135.7， 在 流 还 有 
数据 可 读 时 ， 挂 起 消息 可 能 到 达 流 首 。 对 于 管道 ， 我 们 希望 在 处 理 挂 起 前 先 读 所 有 数据 。 但 是 
对 于 服务 器 进程 ， 当 从 客户 进程 接收 到 挂 起 消息 时 ， 它 可 以 用 close 关 闭 至 客户 进程 的 连接 
( 流 )， 于 是 也 就 丢弃 了 仍 在 流 上 的 所 有 数据 。 因 为 已 经 不 能 回 送 任何 响应 ， 所 以 也 就 没有 理由 
再 去 处 理 仍 在 流 上 的 任何 请 求 。 

如 同 此 函数 的 select 版 本 ， 我 们 调用 request 函 数 处 理 来 自 客户 进程 的 新 请 求 (程序 清 
单 17-32)。 此 函数 类 似 于 其 早期 版 本 (程序 清单 17-23)。 它 调用 同一 函数 buf_args (程序 清 
单 17-24)， 后 者 又 调用 cli_args (程序 清单 17-25) ， 但 是 因为 它 是 在 一 个 守护 进程 中 运行 的 ， 
所 以 出 错 消 息 是 在 日 志文 件 中 记录 ， 而 不 是 在 标准 出 错 流 上 打印 。 


程序 清单 17-32 request MAA] 


#include "Opend.h" 
#include «fcntl.h» 
void 


request (char *buf, int nread, int clifd, uid t uid) 
int newfd; 


if (bufinread-1] !- 0) { 
sprintf (errmsg, . 
"request from uid &d not null terminated: &*.*s\n", 
uid, nread, nread, buf); 
send err(clifd, -1, errmsg); 
return; 
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log_msg("request: %s, from uid %d", buf, uid); 


/* parse the arguments, set options */ 
if (buf_args(buf, cli_args) < 0) { 
send_err(clifd, -1, errmsg); 
log_msg (errmsg) ; 
return; 


} 


if ((newfd = open(pathname, oflag)) « 0) { 
sprintf (errmsg, "can't open $s: %s\n", 
pathname, strerror (errno) ); 
send_err(clifd, -1, errmsg); 
log msg (errmsg) ; 
return; 


} 


/* gend the descriptor */ 
if (send fd(clifd, newfd) « 0) 
log sys("send fd error"); 
log msg('"sent fd *d over fd %d for ts", newfd, clifd, pathname); 
close (newfd) ; /* we're done with descriptor */ 


) 
这 样 就 完成 了 open 服 务 器 进程 版 本 2， 它 使 用 单个 守护 进程 处 理 所 有 的 客户 进程 请 求 。 
17.7 小 结 


本 章 的 重点 是 如 何 实现 在 进程 间 传 送 文 件 描述 符 ， 以 及 怎样 使 服务 器 进程 接受 来 自 众多 客 

户 进 程 的 唯一 连接 。 本 章 说 明了 如 何 使 用 基于 STREAMS 的 管道 以 及 UNIX 域 套 接 字 实 现 这 些 功 

能 。 虽 然 所 有 平台 都 支持 UNIX 域 套 接 字 (参见 表 15-1)， 但 是 各 种 实现 都 有 不 同 之 处 ， 这 使 我 

们 很 难 开发 可 移植 的 应 用 程序 。 

本 章 给 出 了 open 服 务 器 进程 的 两 个 版 本 。 一 个 版 本 由 客户 进程 用 fork 和 exec 直 接 调用 ， 

另 一 版 本 是 处 理 所 有 客户 进程 请 求 的 守护 服务 器 进程 。 这 两 个 版 本 均 采 用 文件 描述 符 传送 和 接 

收 函 数 。 后 一 版 本 还 采用 了 17.2.2 节 所 述 的 客户 进程 -服务 器 进程 连接 函数 以 及 14.5 节 所 述 的 

VOZ RFE AR, 

习题 

17. 改写 程序 清单 17-1， 对 于 STREAMS 管 道 使 用 标准 IO 库 函 数 代替 readq 和 write。 

17.2 使 用 本 章 说 明 的 文件 描述 符 传送 函数 以 及 8.9 节 中 说 明 的 父 - 子 进 程 同步 例 程 ， 编 写 具 有 
下 列 功能 的 程序 :该 程 序 调 用 fork， 然 后 子 进 程 用 open 打 开 一 现存 文件 并 将 打开 文件 
描述 符 传 送 给 父 进程 。 接 着 ， 子 进程 调用 lseek 确 定 该 文件 当前 读 、 写 位 置 ， 并 通知 父 
进程 。 父 进程 读 该 文件 的 当前 偏 移 量 ， 并 打印 它 以 便 验证 。 若 此 文件 如 上 所 述 从 子 进程 
传递 到 父 进 程 ， 则 父 、 子 进程 应 共享 同一 文件 表 项 ， 所 以 当 子 进程 每 次 更 改 该 文件 当前 
偏 移 量 ， 都 会 同样 影响 到 父 进 程 的 描述 符 。 使 子 进程 将 该 文件 定位 至 一 个 不 同 的 偏 移 量 ， 
并 再 次 通知 父 进 程 。 

17.3 程序 清单 17-21 和 17-22 分 别 定义 和 声明 了 全 局 变量 ， 两 者 的 区 别 是 什么 ? 

174 改写 buf_args 函 数 ( 见 程序 清单 17-24)， 删 除 其 中 对 argv 数 组 长 度 的 编译 时 间 限 制 。 
请 用 动态 存储 分 配 。 

17.5 说 明 优化 程序 清单 17-30 和 17-31 中 loop 函 数 的 方法 ， 并 实现 之 。 
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所 有 操作 系统 的 终端 VO 处 理 都 是 非常 繁琐 的 ，UNIX 也 不 例外 。 在 大 多 数 版 本 的 UNIX 手 册 
中 ,终端 YO 手册 页 常常 是 最 长 的 部 分 。 

20 世 纪 70 年 代 后 期 ，UNIX 系 统 了 开发 了 与 传统 的 V7 不 同 的 一 组 终端 例 程 ， 从 而 形成 了 
UNIX 终 端 MO 处 理 的 两 种 不 同 风格 ， 系 统 亚 的 风格 一 直 延 续 至 系统 V，V7 的 风格 则 成 为 BSD 类 
系统 的 标准 风格 。POSIX.1 在 这 两 种 风格 的 基础 上 制定 了 终端 VO 标准 。 本 章 将 介绍 POSIX.1 的 
终端 函数 ， 以 及 某 些 平台 特有 的 增加 部 分 。 

终端 1O 的 用 途 很 广泛 ， 包 括 用 于 终端 、 计 算 机 之 间 的 直接 连 线 、 调 制 解 调 器 以 及 打印 机 等 
等 ， 所 以 终端 VO 系统 非常 复杂 。 


18.2 综述 


终端 MO 有 两 种 不 同 的 工作 模式 : 

(1) 规范 模式 输入 处 理 (Canonical mode input processing) 。 在 这 种 模式 中 ， 终 端 输入 以 行 
为 单位 进行 处 理 。 对 于 每 个 读 要 求 ， 终 端 驱动 程序 最 多 返回 一 行 。 

(2) 非 规 范 模式 输入 处 理 (Noncanonical mode input processing) 。 输 入 字符 并 不 组 成 行 。 

如 果 不 作 特 殊 处 理 ， 则 默认 模式 是 规范 模式 。 例 如 ， 若 shell 把 标准 输入 重 定向 到 终端 ， 在 
用 zxead 和 write 将 标准 输入 复制 到 标准 输出 时 ， 终 端 以 规范 模式 进行 工作 ， 每 次 read 最 多 返 
回 一 行 。 操 纵 整 个 屏幕 的 程序 (例如 vi 编辑 程序 ) 使 用 非 规范 模式 ， 原 因 是 它 的 命令 是 由 一 个 
或 几 个 字符 组 成 的 ， 并 且 不 以 换行 符 终止 。 另 外 ， 该 编辑 程序 使 用 了 若干 特殊 字符 作为 编辑 命 
令 ， 所 以 它 也 不 希望 系统 对 特殊 字符 进行 处 理 。 例 如 ，Ctrl+D 字 符 通常 是 终端 的 文件 结束 符 ， 
但 在 vi 中 它 是 向 下 滚动 半 个 屏幕 的 命令 。 


V7 和 较 早 BSD 风 格 类 的 终端 驱动 程序 支持 三 种 终端 输入 模式 : (a) 精细 加 工 模 式 《输入 组 成 行 ， 
并 对 特殊 字符 进行 处 理 ) ; O 原始 模式 (输入 不 组 成 行 ， 也 不 对 特殊 字符 进行 处 理 ) ; (c) cbreak 模 式 
(输入 不 组 成 行 ， 但 对 某 些 特殊 字符 进行 处 理 ) 。 程 序 清单 18-10 显 示 了 将 终端 设置 为 cbreak 或 原始 模式 
的 POSIX.1 函 数 。 


POSIX.1 定 义 了 11 个 特殊 输入 字符 ， 其 中 9 个 可 以 改变 。 本 书 已 经 用 到 了 其 中 几 个 ， 例 如 文 
件 结 束 符 (通常 是 Ctrl+D)、 挂 起 字符 (通常 是 Ctrl+Z)。18.3 苘 将 对 其 中 每 个 字符 进行 说 明 。 

终端 设备 是 由 一 般 位 于 内 核 中 的 终端 驱动 程序 控制 的 。 每 个 终端 设备 有 一 个 输入 队列 和 一 
个 输出 队列 ， 如 图 18-1 所 示 。 
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进程 写 的 下 一 个 字符 进程 读 的 下 一 个 字符 


| 车 回 送 字符 | Heca 
mcum [se [7 
EM 


MAX INPUT 一 一 
传送 给 设备 的 下 一 个 字符 设备 读 的 下 一 个 字符 
图 18-1 终端 设备 的 输入 、 输 出 队列 逻辑 结构 


对 此 图 要 说 明 下 列 几 点 : 

。 如 果 打 开 了 回 显 功能 ， 则 在 输入 队列 和 输出 队列 之 间 有 一 个 隐 含 的 连接 。 

。 输 入 队列 的 长 度 MAX_INPUT ( 见 表 2-11) 是 有 限 值 ， 当 一 个 特定 设备 的 输入 队列 已 经 
填 满 时 ， 系 统 对 此 作 何 种 处 理 依赖 于 实现 。 大 多 数 UNIX 系 统 的 处 理 方式 是 回 显 响 铃 





字符 。 
* 图 中 没有 显示 另 一 个 输入 限制 MAx_caNoN， 它 是 在 一 个 规范 输入 行 中 的 最 大 字 节 数 。 
“虽然 输出 队列 通常 也 是 有 限 长 度 ， 但 是 程序 并 不 能 获得 这 


个 定义 其 长 度 的 常量 ， 这 是 因为 当 输出 队列 将 要 填 满 时 ， 内 
核 使 写 进程 休眠 直至 写 队列 中 有 可 用 的 空间 ， 所 以 程序 无 需 0 l1 ] 
关心 该 队列 的 长 度 。 读 、 写 函数 ' 





我 们 将 说 明 如 何 使 用 tcflush 函 数 刷 清 (flush) 输入 或 输 | 
出 队列 。 与 此 类 似 ， 在 说 明 tcsetattr 函 数 时 ， 我 们 将 会 | 
了 解 到 如 何 通知 系统 只 有 在 输出 队列 为 空 时 才 改 变 一 个 终端 。 ， | ae 





设备 的 属性 。( 例 如 ， 想 要 改变 输出 属性 时 就 要 这 样 做 。) | | 
我 们 也 能 通知 系统 ， 当 它 正在 改变 终端 属性 时 ， 要 丢弃 在 输 NNNM 
入 队列 中 的 一 切 东西 。( 如 果 正 在 改变 输入 属性 ， 或 者 在 规 || mede ， 
范 和 非 规范 模式 之 间 进行 转换 ， 则 可 能 希望 这 样 做 ， 以 免 以 
错误 的 模式 对 以 前 输入 的 字符 进行 解释 。) 
大 多 数 UNIX 系 统 在 一 个 称 为 终端 行规 程 (terminal line 实际 设备 
discipline) 的 模块 中 进行 规范 处 理 。 它 是 位 于 内 核 通用 读 、 写 函 18-2 终端 行规 各 
数 和 实际 设备 驱动 程序 之 间 的 模块 ( 见 图 18-2) 。 
注意 ， 此 图 与 关于 流 模块 的 图 14-5 非 常 类 似 。 在 第 19 章 讨论 伪 终 端 时 还 将 使 用 此 图 。 
所 有 我 们 可 以 检测 和 更 改 的 终端 设备 特性 都 包含 在 termios 结 构 中。 该 结构 定义 在 头 文件 
<termios.h> 中 ， 本 章 经 常 使 用 这 一 头 文件 。 


struct termios { 
tcflag t c.iflag; /* input flags */ 











tcflag t c_oflag; /* output flags */ 
tcflag t c cflag; /* control flags */ 
tcflag t c lflag; /* local flags */ 

cc t c cc[NCCS]; /* control characters */ 


) 


HEME, f AJ HH t Dc t DESERT PED P BUE TERIS AL IRA A AES, eur 
输入 奇偶 校 验 等 等 ), 输出 标志 则 控制 驱动 程序 输出 (执行 输出 处 理 、 将 换行 符 映 射 为 CR/LF 等 )， 
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控制 标志 影响 到 RS-232 串 行 线 (忽略 调制 解 调 器 的 状态 线 、 每 个 字符 的 一 个 或 两 个 停止 位 等 等 )， 
本 地 标志 影响 驱动 程序 和 用 户 之 则 的 接口 ( 回 送 的 开 或 关 、 可 视 的 控 除 字符 、 终 端 产生 的 信和 号 
的 启用 以 及 对 后 台 输 出 的 作业 控制 停止 信号 等 )。 

类 型 tcflag_t 的 长 度 足 以 保存 每 个 标志 值 。 它 经 常 被 定义 为 unsigned int 或 者 
unsigned long。c_cc 数 组 包含 了 所 有 可 以 更 改 的 特殊 字符 。NCCS 是 该 数组 的 长 度 ， 一 
介 于 15 到 20 之 间 (大 多 数 UNIX 系 统 支 持 的 特殊 字符 较 POSIX 所 定义 的 11 个 要 多 )。cc_t 类 型 的 
长 度 足 以 保存 每 个 特殊 字符 ， 而 且 它 往往 是 unsigned char 型 的 。 


POSIX 标 准 之 前 的 系统 V 版 本 有 一 个 名 为 <termio.h> 的 头 文件 、 
为 了 区 别 于 这 些 老 名 字 ，POSIX.1 在 新 名 字 后 加 了 一 个 s。 


一 个 名 为 termio 的 数据 结构 。 


表 18-1 至 表 18-4 列 出 了 所 有 可 以 进行 更 改 以 影响 终 端 设 备 特性 的 终端 标 ub. TER, mA 
Single UNIX Specification 定 义 了 所 有 平台 都 支持 的 公共 子 集 , 但 是 各 平台 还 有 自己 的 扩充 部 分 。 
这 些 扩 充 部 分 与 系统 各 自 不 同 的 历史 发 展 过 程 有 关 。18.5 节 将 详细 讨论 这 些 标志 


表 18-1 c_cflag 终 端 标志 








CBAUDEXT 
CCAR_OFLOW 
CCTS_OFLOW 
CDSR_OFLOW 
CDTR_IFLOW 
CIBAUDEXT 
CIGNORE 
CLOCAL 
CREAD 
CRTSCTS 
CRTS_IFLOW 
CRTSXOFF 
CSIZE 
CSTOPB 
HUPCL 
MDMBUF 
PARENB 
PAREXT 
PARODD 














BRKINT 接 到 BREAK 时 产生 SIGINT 
ICRNL 将 输入 的 CR 转换 为 N L 
IGNBRK 忽略 BREAK 条 件 

IGNCR 忽略 CR 

IGNPAR 忽略 奇偶 错字 符 


| 扩充 的 波 特 率 | 充 的 波 特 率 
输出 的 DCD 流 控制 
输出 的 CT S 流 控制 
输出 的 DSR 流 控制 
输出 的 DTR 流 控制 

扩充 输入 波 特 率 

忽略 控制 标志 

忽略 调制 解 调 器 状态 行 
启用 接收 装置 

启用 硬件 流 控制 
输入 的 RTS 流 控制 
启用 输入 硬件 流 控制 
字符 大 小 屏蔽 

送 两 个 停止 位 ， 否 则 为 1 位 
最 后 关闭 时 断 开 

与 CCAR_OFLOW 相 同 
进行 奇偶 校 验 
标记 或 空 奇偶 性 

奇 校 验 ， 否 则 为 偶 校 验 














Mac OS X Solaris 
lee UE 3 
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IMAXBEL | 在 给 入 队列 满 时 振 铃 。 | 

INLCR 将 输入 的 NL 转换 为 CR 

INPCK 打开 输入 奇偶 校 验 

ISTRIP 剥 除 输入 字符 的 第 8 位 

IUCLC 将 输入 的 大 写字 符 转 换 成 小 写字 符 
IXANY 使 任 一 字符 都 重新 启动 输出 
IXOFF 使 启动 /停止 输入 控制 流 起 作用 
IXON 使 启动 /停止 输出 控制 流 起 作用 
PARMRK 标记 奇偶 错 


ALTWERASE | 使 用 替换 WERASE 算 法 — | 
ECHO 进行 回 送 

ECHOCTL 回 送 控制 字符 为 ^(Char) 
ECHOE 可 见 擦 除 符 

ECHOK 回 送 kill 符 

ECHOKE kill 的 可 见 擦 除 


ECHONL 回 送 NL 

ECHOPRT 硬 拷贝 的 可 见 擦 除 方式 
EXTPROC 外 部 字符 处 理 

FLUSHO 刷 清 输出 

ICANON 规范 输入 

IEXTEN 启用 扩充 的 输入 字符 处 理 
ISIG 启用 终端 产生 的 信号 
NOFLSH | 在 中 断 或 退出 键 后 禁用 刷 清 
NOKERNINFO 由 STATUS 无 内 核 输出 
PENDIN 重新 打印 未 决 输 入 

TOSTOP 对 于 后 台 输 出 发 送 SIGTTOU 
XCASE 规范 的 大 /小 写 表示 


BSDLY SBR HEIR BR RK 

CMSPAR | 标记 或 空 奇偶 性 

CRDLY CR 延迟 屏蔽 

FFDLY 换 页 延迟 屏蔽 

NLDLY NE 延迟 屏蔽 

OCRNL 将 输出 的 CR 转换 为 NL 
OFDEL 填充 符 为 DEL， 否 则 为 NUL 
OFILL 对 于 延迟 使 用 填充 符 
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OLCUC 将 输出 的 小 写字 符 转 换 为 大 写字 符 
ONLCR 将 NL 转 换 为 CR-NL 
ONLRET NL 执 行 CR 功 能 


ONOCR 在 0 列 不 输出 CR 

ONOEOT 在 输出 中 删除 EOT(^D) 字 符 
OPOST 执行 输出 处 理 

OXTABS 将 制 表 符 扩充 为 空格 
TABDLY 水 平 制 表 符 延 迟 屏蔽 
VTDLY 垂直 制 表 符 延 迟 屏蔽 





给 出 了 所 有 可 用 的 选项 后 ， 如 何 才 能 检测 和 更 改 终端 设备 的 这 些 特性 呢 ? 表 18-5 列 出 了 
Single UNIX Specification 所 定义 的 对 终端 设备 进行 操作 的 各 个 函数 。( 除 tcgetsid 是 Single 
UNIX Specification 的 XSI 扩 展 外 ， 列 出 的 其 他 函数 都 是 POSIX 规 范 的 基本 部 分 。9.7 节 已 说 明了 
tcgetpgrp、tcgetsid 和 tcsetpgrp 国 数 。) 

表 18-5 终端 /0 函数 摘要 


tcgetattr 取 属 性 (termios 结 构 ) 
tcsetattr 设置 属性 (termios 结 构 ) 


cfgetispeed 得 到 输入 速度 





























cfgetospeed 得 到 输出 速度 
cfsetispeed 设置 输入 速度 


设置 输出 速度 
等 待 所 有 输出 都 被 传输 


cfsetospeed 






tcdrain 















tcflow 挂 起 传输 或 接收 
tcflush 刷 清 未 决 输 入 和 /或 输出 
tcsendbreak WR BREAK Tf 







得 到 前 台 进 程 组 ID 
设置 前 台 进 程 组 ID 
得 到 控制 TTY 的 会 话 首 进程 的 进程 组 ID (XSI 扩 展 ) 






tcgetpgrp 
tcsetpgrp 





tcgetsid 


注意 ， 对 终端 设备 ，Single UNIX Specification 没 有 使 用 经 典 的 ioct1， 而 使 用 了 表 18-5 中 
列 出 的 13 个 函数 。 这 样 做 的 理由 是 : 对 于 终端 设备 的 loct1 函 数 ， 其 最 后 一 个 参数 的 数据 类 型 
随 执 行动 作 的 不 同 而 不 同 。 于 是 ， 这 使 得 对 参数 进行 类 型 检查 成 为 不 可 能 。 

虽然 对 终端 设备 进行 操作 只 有 13 个 函数 ,但 是 表 18-5 中 头 两 个 函数 (tcgetattr 和 
tcsetattr) 能 处 理 大 约 70 种 不 同 的 标志 ( 见 表 18-1 至 表 18-4)。 对 于 终端 设备 有 大 量 选 项 可 
供 使 用 ， 此 外 ， 对 于 一 个 特定 设备 (终端 、 调 制 解 调 器 、 激 光 打 印 机 等 等 ) 还 要 决定 所 需 的 选 
项 ， 这 些 都 使 对 终端 设备 的 处 理 变 得 异常 复杂 。 

表 18-5 中 列 出 的 13 个 函数 之 间 的 关系 示 于 图 18-3 中 。 


POSIX.1 没 有 规定 在 termios 结 构 中 何 处 看 效 波 特 率 信息 ， 那 是 具体 实现 的 细节 。 某 些 系 统 〈 例 如 
Linux 和 Solaris) 将 此 信息 在 放 在 c_cflag 字 段 中 。BSD 派 生 的 系统 (例如 FreeBSD 和 Mac OS X) 则 在 
此 结构 中 有 两 个 分 开 的 字段 : 一 个 看 效 输入 速度 ， 另 一 个 则 看 效 输出 速度 。 


bbs.theithome.com 





512 第 18 章 终端 IO 











cfsetispeed 





cfgetispeed 





Struct: j LE Sees ae m 
termios 


tcsetattr 


637 图 18.3 


18.3 特殊 输入 字符 





cfsetospeed 
cfgetospeed 






前 台 进 程 组 ID 





















tcdrain 
tcflush 





tcsendbreak 
tcflow 





tcgetattr 


tcsetpgrp 


tcgetsid 










终端 行规 程 /终端 设备 驱动 程序 


与 终端 有 关 的 函数 之 间 的 关系 


POSIX.1 定 义 了 11 个 在 输入 时 作 特 殊 处 理 的 字符 。 实 现 定 义 了 另外 一 些 特 殊 字符 。 表 18-6 


摘要 列 出 了 这 些 特 殊 字符 。 


表 18-6 终端 特殊 输入 字符 


延迟 挂 起 (SIGTSTP) | VDSUSP 
文件 结束 VEOF 

行 结束 VEOL 

供 替换 的 行 结束 VEOL2 

向 前 擦 除 一 个 字符 VERASE 
MARRS | VERASE2 


中 断 信号 (SIGINT) | VINTR 
VKILL 
VLNEXT 
(不 能 更 改 ) 
退出 信号 (SIGQUIT) | vourT 
再 打印 全 部 输入 VREPRINT 
VSTART 
VSTATUS 
VSTOP 
VSUSP 
WERASE | 擦 除 一 个 字 VWERASE 


CANON 
IEXTEN 

SIG 
ICANON 
CANON 
ICANON 
CANON 
CANON 
ISIG 

CANON 
IEXTEN 
CANON 
ISIG 
ICANON 
XON/IXOFF 
CANON 
IXON/IXOFF 
ISIG 
CANON 














在 POSIX.1 的 11 个 特殊 字符 中 ， 可 将 其 中 9 个 更 改 为 几乎 任何 值 。 不 能 更 改 的 两 个 特殊 字符 
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是 换行 符 和 回 车 符 (\n 和 \r)， 有 些 实现 也 不 允许 更 改 STOP 和 START 字 符 。 为 了 进行 修改 ， 
只 要 更 改 termios 结 构 中 c_cc 数 组 的 相应 项 。 该 数组 中 的 元 素 都 用 名 字 作 为 下 标 进行 引用 ， 
每 个 名 字 都 以 字母 V 开 头 ( 见 表 18-6 中 的 第 3 列 )。 

POSIX.1 人 允许 禁用 这 些 字符 。 若 将 c_cc 数 组 中 的 某 项 设置 为 _POSIX_VDISABLE 的 值 ， 则 
禁用 相应 的 特殊 字符 。 


Single UNIX Specification 的 早期 版 本 中 ， 支 持 _POSIX_ VDISABLE 是 作为 可 选项 的 。 现 在 则 是 作为 
ERA, 

本 书 讨论 的 四 种 平台 都 支持 此 特性 。Linux 2.4.22 和 Solaris 9: POSIX VDISABLEZ 390, 而 
FreeBSD 5.2.1 和 Mac OS X 10.3 则 将 其 定义 为 OxfE。 

菜 些 早期 的 UNIX 系 统 所 用 的 方法 是 : 若 相应 的 特殊 输入 字符 是 0， 则 禁用 该 字符 。 


实例 
在 详细 说 明 各 特殊 字符 之 前 ， 先 看 一 个 更 改 特殊 字符 的 程序 。 程 序 清单 18-1 禁 用 中 断 字符 ， 
并 将 文件 结束 符 设置 为 Ctrl+B。 
程序 清单 18-1 禁用 中 断 字符 和 更 改 文件 结束 字符 


#include "apue.h" 
#include «termios.h» 
int 

main (void) 


struct termios term; 
long vdisable; 


if (isatty(STDIN FILENO) == 0) 
err quit("standard input is not a terminal device"); 


if ((vdisable = fpathconf (STDIN FILENO, PC VDISABLE)) < 0) 
err quit("fpathconf error or POSIX VDISABLE not in effect"); 


if (tcgetattr(STDIN FILENO, &term) « 0) /* fetch tty state */ 
err sys("tcgetattr error"); 


term.c cc[VINTR] - 
term.c cc[VEOF] - 


vdisable; /* disable INTR character */ 
2; /* EOF is Control-B */ 


if (tcsetattr(STDIN FILENO, TCSAFLUSH, &term) « 0) 
err sys("tcsetattr error"); 


exit(0); 


) 





对 此 程序 要 说 明 下 列 几 点 : 

。 仅 当 标准 输入 是 终端 设备 时 才 修 改 终端 特殊 字符 。 调 用 isatty ( 见 18.9 节 ) 对 此 进行 检测 。 

。 用 fpathconf 取 ._POSIX_VDISABLE 值 。 

*metcgetattr ( 见 18.4 节 ) 从 内 核 取 termios 结 构 。 在 修改 了 此 结构 后 ， 调 用 
tcsetattr 函 数 设置 属性 ， 这 样 就 可 进行 我 们 所 希望 的 修改 ， 而 其 他 属性 则 保持 不 变 。 

。 禁 用 中 断 键 与 忽略 中 断 信号 是 不 同 的 。 程 序 清 单 18-1 所 做 的 是 禁止 使 用 使 终端 驱动 程序 
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下 面 较 详 细 地 说 明 各 个 特殊 字符 。 我 们 称 这 些 字符 为 特殊 输入 字符 ， 但 是 其 中 STOP 和 
START (Ctrl+S 和 Ctrl+Q) 两 个 字符 在 输出 时 也 对 它们 进行 特殊 处 理 。 注 意 ， 这 些 字符 中 的 大 
多 数 在 被 终端 驱动 程序 识别 并 进行 特殊 处 理 后 都 被 丢弃 ， 并 不 将 它们 传送 给 执行 读 终端 操作 的 
进程 。 例 外 的 字符 是 换行 符 (NL, EOL, EOL2) 和 回 车 符 (CR)。 


CR 


DISCARD 


DSUSP 


EOF 


EOL 
EOL2 


ERASE 


ERASE2 
INTR 


KILL 


LNEXT 


回 车 符 。 不 能 更 改 此 字符 。 以 规范 模式 进行 输入 时 识别 此 字符 。 当 设置 了 
ICANON (规范 模式 ) 和 ICRNL (将 CR 映射 为 NL) 以 及 没有 设置 IGNCR (05 
WECR) 时 ， 将 CR 转换 成 NL， 并 产生 与 NL 符 相同 的 作用 。 

此 字符 返回 给 读 进程 (多 半 是 在 转换 成 NL 后 )。 

删除 符 。 在 扩充 模式 下 (IEXTEN)， 在 输入 中 识别 此 字符 。 在 输入 另 一 个 
DISCARD 符 之 前 或 删除 条 件 被 清除 之 前 〈 见 FLUSHO 选 项 ) ， 此 字符 使 后 续 输 
出 都 被 删除 。 在 处 理 后 此 字符 即 被 删除 ， 不 送 向 读 进 程 。 

延迟 - 挂 起 作业 控制 字符 (delayed-suspend job-control character) 。 在 扩充 方式 
下 ， 车 支持 作业 榨 制 并 且 ISIG 标 志 被 设置 ， 则 在 输入 中 识别 此 字符 。 与 SUSP 
字符 的 相同 处 是 ， 延迟 一 挂 起 字符 产生 STGTSTP 信 号 ， 它 被 送 至 前 台 进 程 组 中 
的 所 有 进程 (参见 图 9-7) 。 但 是 延迟 - 挂 起 字符 产生 信和 号 的 时 间 并 不 是 在 键入 
此 字符 时 ， 而 是 在 一 个 进程 读 控制 终端 读 到 此 字符 时 。 在 处 理 后 ， 此 字符 即 被 
删除 ， 不 送 向 读 进程 。 

文件 结束 符 。 以 规范 模式 (ICANON) 进行 输入 时 识别 此 字符 。 当 键入 此 字符 
时 ， 等 待 被 读 的 所 有 字 节 都 立即 传送 给 读 进 程 。 如 果 没 有 字 节 等 待 读 ， 则 返回 
0。 在 行 首 输入 一 个 EOF 符 是 向 程序 指示 文件 结束 的 正常 方式 。 在 以 规范 模式 
处 理 后 ， 此 字符 即 被 删除 ， 不 送 向 读 进程 。 

附加 的 行 定 界 符 ， 与 NL 作用 相同 。 以 规范 模式 (ICANON) 进行 输入 时 识别 此 
字符 ， 并 将 此 字符 返回 给 读 进程 。 但 通常 不 使 用 此 字符 。 

另 一 个 行 定 界 符 ， 与 NL 作用 相同 。 对 此 字符 的 处 理 方 式 与 EOL 字 符 相 同 。 
BREA 〈 退 格 ) 。 以 规范 模式 (ICANON) 输入 时 识别 此 字符 。 它 擦 除 行 中 
的 前 一 个 字符 ， 但 不 会 超越 行 首 字符 擦 除 上 一 行 中 的 字符 。 在 以 规范 模式 处 理 
后 此 字符 即 被 删除 ， 不 送 向 读 进程 。 

另 一 个 擦 除 字符 ( 退 格 )。 对 此 字符 的 处 理 与 ERASE 完 全 相同 。 

中 断 字符 。 若 设置 了 ISIG 标 志 ， 则 在 输入 中 识别 此 字符 。 它 产生 SIGINT 信 
号 ,该 信号 被 送 至 前 台 进 程 组 中 的 所 有 进程 (参见 图 9-7)。 在 处 理 后 ， 此 字符 
即 被 删除 ， 不 送 向 读 进 程 。 

kill ( 杀 死 ) 字符 。( 名 字 “ 杀 死 ” 在 这 里 又 一 次 被 误 用 ， 回 忆 ki11 孙 数 ， 它 
将 一 信号 发 送 给 进程 。 此 字符 应 被 称 为 行 擦 除 符 ， 它 与 信号 毫 无 关系 。) AWR 
范 模式 (ICANON) 输入 时 识别 此 字符 。 它 擦 除 一 整 行 。 在 处 理 后 ， 此 字符 即 
被 删除 ， 不 送 向 读 进 程 。 

“字面 上 的 下 一 个 ”字符 (literal-next character) 。 以 扩充 方式 (IEXTEN) $ 
入 时 识别 此 字符 ， 它 使 下 一 个 字符 的 任何 特殊 含义 都 被 忽略 。 这 对 本 节 提 及 的 
所 有 特殊 字符 都 起 作用 。 使 用 这 一 字符 可 向 程序 键入 任何 字符 。 在 处 理 后 ， 
LNEXT 字 符 即 被 删除 ， 但 输入 的 下 一 个 字符 则 被 传送 给 读 进程 。 


bbs.theithome.com 





NL 


QUIT 


REPRINT 


START 


STATUS 


STOP 


SUSP 


WERASE 
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新 行 字符 ， 它 也 被 称 为 行 定 界 符 。 不 能 更 改 此 字符 。 以 规范 模式 (ICANON) 
输入 时 识别 此 字符 。 此 字符 返回 给 读 进 程 。 

退出 字符 。 若 设置 了 ISIG 标 志 ， 则 在 输入 中 识别 此 字符 。 它 产生 SIGQUIT 信 
号 ， 该 信号 又 被 送 至 前 台 进 程 组 中 的 所 有 进程 (参见 图 9-7) 。 在 处 理 后 ， 此 字 
符 即 被 删除 ， 不 送 向 读 进程 。 

回忆 表 10-1，INTR 和 QUIT 的 区 别 是 : QUIT 字 符 不 仅 按 默认 终止 进程 ， 而 且 也 
产生 core 文 件 。 

再 打印 字符 。 以 扩充 规范 模式 (设置 了 IEXTEN 和 ICANON 标 志 ) 进行 输入 时 
识别 此 字符 。 它 使 所 有 未 读 的 输入 被 输出 (再 回 显 )。 在 处 理 后 ， 此 字符 即 被 
删除 ， 不 送 向 读 进 程 。 

启动 字符 。 若 设置 了 IXON 标 志 则 在 输入 中 识别 此 字符 ， 若 设置 IXOFF 标 志 ， 
则 作为 输出 自动 产生 此 字符 。 在 IXON 已 设置 时 接收 到 的 START 字 符 使 停止 的 
输出 (由 以 前 输入 的 STOP 字 符 造 成 ) 重新 启动 。 在 此 情形 下 ， 此 字符 处 理 后 
即 被 删除 ， 不 送 向 读 进 程 。 

在 IXOFF 标 志 设 置 时 ， 若 输入 不 会 使 输入 缓冲 区 溢出 ， 则 终端 驱动 程序 自动 地 
产生 一 START 字 符 以 恢复 以 前 被 停止 的 输入 。 

BSD 的 状态 -请 求 字符 。 以 扩充 规范 模式 (设置 IEXTEN 和 ICANON 标 志 ) 进 
行 输入 时 识别 此 字符 。 它 产生 SIGINEFO 信 和 号， 该 信号 又 被 送 至 前 台 进程 组 中 
的 所 有 进程 ( 见 图 9-7)。 另 外 ， 如 果 没 有 设置 NOKERNINFO 标 志 ， 则 有 关 前 
台 进 程 组 的 状态 信息 也 显示 在 终端 上 。 在 处 理 后 ， 此 字符 即 被 删除 ， 不 送 向 
停止 字符 。 若 设置 了 IXON 标 志 ， 则 在 输入 中 识别 此 字符 ， 若 IXOFF 标 志 已 设 
置 则 作为 输出 自动 产生 此 字符 。 在 IXON 已 设置 时 接收 到 STOP 字 符 则 停止 输出 。 
在 此 情形 下 ， 处 理 后 删除 此 字符 ， 不 送 向 读 进 程 。 当 输入 一 个 START 字 符 后 ， 
停止 的 输出 重新 启动 。 

在 IXOFF 设 置 时 ， 终 端 驱 动 程序 自动 地 产生 一 个 STOP 字 符 以 防止 输入 缓冲 区 
溢出 。 

挂 起 作业 控制 字符 。 若 支持 作业 控制 并 且 ISIG 标 志 已 设置 ， 则 在 输入 中 识别 
此 字符 。 它 产生 SIGTSTP 信 号 ， 该 信号 又 被 送 至 前 台 进 程 组 的 所 有 进程 ( 见 
图 9-7)。 在 处 理 后 ， 此 字符 即 被 删除 ， 不 送 向 读 进 程 。 

字 擦 除 字符 。 以 扩充 规范 模式 (设置 IEXTEN 和 ICANON 标 志 ) 进 行 输入 时 识别 
此 字符 。 它 擦 除 前 一 个 字 。 首 先 ， 它 向 后 跳 过 任 一 空白 字符 (空格 或 制 表 符 )， 
然后 再 向 后 越过 前 一 记号 , 使 光标 处 在 前 一 个 记号 的 第 一 个 字符 位 置 上 。 通常 ， 
前 一 个 记号 在 碰 到 一 个 空白 字符 时 即 终 止 。 但 是 ， 可 用 设置 ALTWERASE 标 志 
来 改变 这 一 点 。 此 标志 使 前 一 个 记号 在 碰 到 第 一 个 非 字 母 、 数 字符 时 即 终止 。 
在 处 理 后 ， 此 字符 即 被 删除 ， 不 送 向 读 进程 。 


需要 为 终端 设备 定义 的 男 一 个 “字符 ”是 BREAK。BREAK 实 际 上 并 不 是 一 个 字符 ， 而 是 


在 异步 串 行 数据 传送 时 发 生 的 一 个 条 件 。 依 赖 于 串 行 接口 ， 可 以 有 多 种 方式 通知 设备 驱动 程序 
发 生 了 BREAK 条 件 。 
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大 多 数 早 期 的 囊 行 终端 有 一 个 标记 为 BREAK 的 键 ， 用 它 可 以 产生 BREAK 条 件 ， 这 就 使 得 很 多 人 
认为 BREAK 就 是 一 个 字符 。 某 些 较 新 的 终端 键 意 没有 BREA 开 键 。 在 PC 上 ，BREAK 刍 有 其 他 的 用 途 。 
例如 键入 Ctrl+BREAK， 可 中 断 Windows 命 令 解 释 器 。 


对 于 异步 串 行 数 据 传送 ，BREAK 是 一 个 0 值 的 位 序列 ， 其 持续 时 间 长 于 要 求 发 送 一 个 字 节 
的 时 间 。 整 个 0 值 位 序列 被 视 为 是 一 个 BREAK。18.8 节 将 说 明 如 何 用 tcsendbreak 函 数 发 送 一 
个 BREAK。 


18.4 获得 和 设置 终端 属性 


使 用 函数 Lcgetattr 和 tcsetattr 可 以 获得 或 设置 Lermios 结 构 。 这 样 也 就 可 以 检测 和 
修改 各 种 终端 选择 标志 和 特殊 字符 ， 以 使 终端 按 我 们 所 希望 的 方式 进行 操作 。 


#include <termios.h> 


int tcgetattr(int filedes, struct termios *termptr); 


int tcsetattr(int filedes, int opt, const struct termios *termptr) ; 


两 个 函数 的 返回 值 ， 若 成 功 则 返回 0。 若 出 错 则 返回 -1 





这 两 个 函数 都 有 一 个 指向 termios 结 构 的 指针 作为 其 参数 ， 它 们 返回 当前 终端 的 属性 ， 或 者 设 
监 该 终端 的 属性 。 因 为 这 两 个 函数 只 对 终端 设备 进行 操作 ， 所 以 若 filedes 并 不 引用 一 个 终端 设 
备 则 出 错 返 回 -1，erzrzno 设 置 为 ENOTTY 。 

tcsetattz 的 参数 opl 使 我 们 可 以 指定 在 什么 时 候 新 的 终端 属性 才 起 作用 。opr 可 以 指定 为 
下 列 常量 中 的 一 个 : 

TCSANOW ”更 改 立 即 发 生 。 

TCSADRAIN 发 送 了 所 有 输出 后 更 改 才 发 生 。 若 更 改 输 出 参数 则 应 使 用 此 选项 。 

TCSAFLUSH 发 送 了 所 有 输出 后 更 改 才 发 生 。 更 进一步 ， 在 更 改 发 生 时 未 读 的 所 有 输入 数 

据 都 被 删除 ( 刷 清 )。 

tcsetattr 函 数 的 运 回 值 易 产生 混淆 。 如 果 它 执行 了 任意 一 种 所 要 求 的 动作 ， 即 使 未 能 
执行 所 有 要 求 的 动作 ， 它 也 返回 0 (表示 成 功 )。 如 果 该 函数 返回 9， 则 我 们 有 责任 检查 该 函数 
是 否 执 行 了 所 有 要 求 的 动作 。 这 就 意味 着 ， 在 调用 tcsetattr 设 置 所 希望 的 属性 后 ， 和 需 调 用 
tcgetattr， 然 后 将 实际 终端 属性 与 所 希望 的 属性 相 比 较 ， 以 检测 两 者 是 否 有 区 别 。 


18.5 终端 选项 标志 


本 市 对 表 18-1 至 表 18-4 中 列 出 的 各 个 终端 选项 标志 按 字母 顺序 作 进 一 步 说 明 ， 指 出 该 选项 
出 现在 四 个 终端 标志 字段 中 的 哪 一 个 (从 选项 名 字 中 看 不 出 它 所 处 的 字段 )， 并 说 明 该 选项 是 
否 是 Single UNIX Specification 定 义 的 ， 列 出 了 支持 该 选项 的 平台 。 

WHA (BRA M E ESD) 都 用 一 位 或 几 位 (设置 或 清除 ) 表示 ， 而 屏蔽 标志 
则 定义 多 位 ， 它 们 组 合 在 一 起 ， 于 是 可 以 定义 多 个 值 。 屏 蔽 标志 有 一 个 定义 名 ， 每 个 值 也 有 一 
个 名 字 。 例 如 ， 为 了 设置 字符 长 度 ， 首 先 用 字符 长 度 屏蔽 标志 CSIZE 将 表示 字符 长 度 的 位 清 0， 
然后 设置 下 列 值 之 一 : CS5、CS6、CS7 或 CS8。 

由 Linux 和 Solaris 支 持 的 6 个 延迟 值 也 有 屏蔽 标志 : BSDLY、CRDLY、 FFDLY, NLDLY, 
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TABDLY 和 VTDLY。 欲 了 解 每 个 延迟 值 的 长 度 请 参阅 Solaris 的 termi o(7D 手 册页 。 如 果 指 定 了 
一 个 延迟 ， 则 OFILL 和 OFDEL 标 志 决 定 是 驱动 器 进行 实际 延迟 还 是 只 是 传输 填充 字符 。 








程序 清单 18-2 例 示 了 怎样 使 用 屏蔽 标志 取 或 设置 一 个 值 。 


程序 清单 18-2 tcgetattr 和 tcsetattr 实 例 


#include "apue.h" 
#include <termios.h> 
int 

main (void) 


{ 


struct termios term; 


if (tcgetattr(STDIN FILENO, &term) « 0) 
err_sya("tcgetattr error"); 


switch (term.c cflag & CSIZE) { 
case CS5 : 
printf("5 bits/byte\n") ; 
break; 
case CS6: 
printf("6 bits/byte\n"); 
break; 
case CS7: 
printf ("7 bits/byteMn") ; 
break; 
case CS8: 
printf("8 bits/byteWMn") ; 
break; 
default: 
printf ("unknown bits/byte\n") ; 


term.c cflag &- ~CSIZE; /* zero out the bits */ 

term.c cflag |= CS8; /* set 8 bits/byte */ 

if (tcsetattr(STDIN FILENO, TCSANOW, &term) < 0) 
err Sys("tcsetattr error"); 


exit(0); 


) 














下 面 说 明 各 选项 标志 : 

ALTWERASE (c lflag, FreeBSD, Mac OS X) 此 标志 设置 时 ， 若 输入 了 WERASE 字 
符 ， 则 使 用 一 个 替换 的 字 擦 除 算法 。 它 不 是 向 后 移动 到 前 一 个 空白 字符 为 
Jk, 而 是 向 后 移动 到 第 一 个 非 字 母 、 非 数字 字符 为 止 。 

BRKINT (c iflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 若 此 标志 
设置 ， 而 IGNBRK 未 设置 ， 则 在 接 到 BREAK 时 ， 刷 清 输 入 、 输 出 队列 ， 并 
产生 一 个 SIGINT 信 和 号。 如果 此 终端 设备 是 一 个 控制 终端 ， 则 将 此 信和 号 送 
给 前 台 进 程 组 各 进程 。 
如 果 IGNBRK 和 BRKINT 都 设 有 设置 ， 但 是 设置 了 PRARMRK， 则 BREAK 被 读 
作为 三 个 字 节 序列 \377，\0 和 \0， 如 果 PARMRK 也 没有 设置 ， 则 BREAK 
被 读 作为 单个 字符 \0。 
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BSDLY 
CBAUDEXT 


CCAR_OFLOW 


CCTS_OFLOW 


CDSR_OFLOW 


CDTR_IFLOW 


CIBAUDEXT 


CIGNORE 
CLOCAL 


CMS PAR 


CRDLY 


CREAD 


CRTSCTS 


CRTS_IFLOW 


CRTSXOFF 


CSIZE 


CSTOPB 


ECHO 


4 3%, VO 


(c_oflag, XSI, Linux, Solaris) 退 格 延迟 屏蔽 ， 此 屏蔽 的 值 是 BS0 或 BS1。 
(c_cflag, Solaris) 扩充 的 波 特 率 。 用 于 允许 大 于 B38400 的 波 特 率 。(18.7 
节 将 讨论 波 特 率 。) 

(c_cflag, FreeBSD, Mac OS X) 打开 输出 的 硬件 流 控 制 ， 该 输出 使 用 
RS-232 调 制 解 调 器 载波 信号 (DCD， 被 称 为 数据 -载波 一 检 测 )。 这 与 早期 
的 MDMBUF 标 志 相 同 。 

(c_cflag, FreeBSD, Mac OS X, Solaris) 使 用 Clear-To-Send (CTS) RS- 
232 信 号 进行 输出 硬件 的 流 控制 。 

(c_cflag, FreeBSD, Mac OS X) 按 Data-Set-Ready (DSR) RS-232 信和 号 
进行 输出 流 控制 。 

(c_cflag, FreeBSD, Mac OS X) 按 Data-Terminal-Ready (DTR) RS-232 
信和 号 进行 输入 流 控制 。 

(c_cflag, Solaris) 扩充 的 输入 波 特 率 ， 用 于 允许 大 于 B38400 的 输入 波 
特 率 。(18.7 节 将 讨论 波 特 率 。) 

(c_cflag, FreeBSD, MacOS X) 忽略 控制 标志 。 

(c_cflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 如 若 设置 ， 
则 忽略 调制 解 调 器 状态 线 。 这 通常 意味 着 该 设备 是 直接 连接 的 。 若 此 标志 
未 设置 ， 则 打开 一 个 终端 设备 常常 会 阻塞 直到 调制 解 调 器 回应 呼叫 并 建立 
连接 。 

(c_of1ag，Linux) 选 择 标记 或 空 奇偶 校 验 。 如 果 PARODD 设 置 ， 则 奇偶 校 
验 位 总 是 1 (标记 奇偶 校 验 ) 。 否 则 奇偶 校 验 位 总 是 0 ( 空 奇偶 校 验 ) 。 
(c_oflag, XSI, Linux, Solaris) 回 车 延迟 屏蔽 。 此 屏蔽 的 值 是 CR0、 
CR1、CR2 和 CR3。 

(c_cflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 如 若 设 置 ， 
则 接收 装置 被 启用 ， 可 以 接收 字符 。 

(c_cflag, FreeBSD, Linux, Mac OS X, Solaris) 其 行为 依赖 于 平台 。 
对 于 Solaris， 如 果 设 置 则 允许 输出 硬件 流 控制 。 在 另外 三 个 平台 上 ， 人 允许 
输入 、 输 出 硬件 流 控 制 (等 效 于 CCTS_OFLOW|CRTS_IFLOW)。 
(c_cflag, FreeBSD, Mac OS X, Solaris) 输入 的 Request-To-Send (RTS) 
流 控制 。 

(c_cflag，Solaris) 如 果 设 置 ， 允 许 输入 硬件 流 控制 ， Request-To-Send 
RS-232 信号 状态 控制 了 流 控制 。 

(c_cflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 此 字段 是 
一 个 屏蔽 标志 ， 它 指明 发 送 和 接收 的 每 个 字 节 的 位 数 。 此 长 度 不 包括 可 能 
有 的 奇偶 校 验 位 。 由 此 屏蔽 标志 定义 的 字段 值 是 csS5、cs6、cs7 和 Cs8， 
分 别 表示 每 个 字 节 包含 5、6、7 和 8 位 。 

(c_cflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 如 若 设置 ， 
则 使 用 两 位 作为 停止 位 ， 否 则 只 使 用 一 位 作为 停止 位 。 

(c_lflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 如 若 设 置 ， 
则 将 输入 字符 回 显 (M) 到 终端 设备 。 在 规范 模式 和 非 规 范 模式 下 都 可 
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ECHOCTL 


ECHOE 


ECHOK 


ECHOKE 


ECHONL 


ECHOPRT 


EXTPROC 


FFDLY 


FLUSHO 


HUPCL 
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以 回 显 字 符 。 

(c_lflag, FreeBSD, Linux, Mac OS X, Solaris), ， 如 若 设置 并 且 ECHO 
也 设置 ， 则 除 ASCII TAB, ASCII NL、START 和 STOP 字 符 外 ， 其 他 ASCII 
控制 符 (ASCI[ 字 符 集中 的 0~037) 都 被 回 显 为 ^X， 其 中 ，X 是 相应 控制 字 
符 代码 值 加 8 进 制 100 所 构成 的 字符 。 这 就 意味 着 ASCII Ctrl+A 字 符 (8 进 
fill) 被 回 显 为 ^A。ASCII DELETE 字 符 (8 进 制 177) 则 回 显 为 ^?。 如 若 此 
标志 未 设置 ， 则 ASCII 控 制 字符 按 其 原样 回 显 。 如 同 ECHO 标 志 ， 在 规范 模 
式 和 非 规范 模式 下 此 标志 对 控制 字符 回 显 都 起 作用 。 

应 当 了 解 的 是 某 些 系统 回 显 EOF 字 符 产 生 的 作用 有 所 不 同 ， 其 原因 是 
EOF 的 典型 值 是 Ctrl+D ， 而 这 是 ASCIE EOT 字 符 ， 它 可 能 使 某 些 终端 挂 断 。 
请 查看 有 关 手 册 。 

(c_lflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 如 若 设置 并 
且 ICANON 也 设置 ， 则 ERASE 字 符 从 显示 中 擦 除 当前 行 中 的 最 后 一 个 字符 。 
这 通常 是 在 终端 驱动 程序 中 写 三 个 字符 序列 “ 退 格 - 空 格 - 退 格 ”而 实现 的 。 
如 若 支 持 WERASE 字 符 ， 则 ECHOE 用 一 个 或 若干 个 上 述 三 字符 序列 擦 除 前 
=R E 

如 若 支持 ECHOPRT 标 志 ， 则 在 ECHOPRT 标 志 没 有 设置 的 情况 下 ， 再 采取 这 
里 所 说 明 的 对 于 ECHOE 的 动作 。 

(c_lflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 如 若 设 置 
并 且 ICANON 也 设置 ， 则 KILL 字 符 从 显示 中 擦 除 当前 行 ， 或 者 输出 NL 字符 
(用 以 强调 已 擦 除 整 个 行 )。 

如 车 支持 ECHOKE 标 志 ， 则 这 里 的 说 明 假定 ECHOKE 标 志 没 有 设置 。 
(c_lflag, FreeBSD, Linux, Mac OS X, Solaris) 如 若 设置 并 且 ICANON 
也 设置 ， 则 回 显 KILL 字 符 的 方式 是 擦 去 行 中 的 每 一 个 字符 。 近 除 每 个 字符 
的 方法 则 由 ECHOE 和 ECHOPRT 标 志 选 择 。 

(c_lflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 如 若 设 置 
并 且 ICANON 也 设置 ， 即 使 没有 设置 ECHO 也 回 显 NL 字 符 。 

(c_lflag, FreeBSD, Linux, Mac OS X, Solaris) 如 若 设 置 并 且 
ICANON 和 ECHO 也 都 设置 ， 则 ERASE 字 符 (以 及 WERASE 字 符 ， 若 受到 支 
HR) 使 所 有 正 被 擦 除 的 字符 按 它们 被 擦 除 的 方式 打印 。 在 硬 撕 贝 终端 上 这 
常常 是 有 用 的 ， 这 样 可 以 确切 地 看 到 哪些 字符 正 被 删除 。 

(c_lflag, FreeBSD, Mac OS X) 如 若 设置 ， 规 范 字符 处 理 在 操作 系统 
之 外 执行 。 如 果 串 行 通 信 外 设 卡 执行 某 些 行规 程 处 理 从 而 减轻 主机 处 理 器 
负载 ， 或 者 使 用 伪 终 端 ( 见 第 19 章 ) ， 那 么 就 可 作 这 种 设置 。 

(c_oflag, XSI, Linux, Solaris) 换 页 延迟 屏蔽 。 此 屏蔽 标志 值 是 FF0 或 
FF1, 

(c. 1flag, FreeBSD, Linux, Mac OS X, Solaris) 如 车 设置 ， 则 刷 清 输 
出 。 当 键入 DISCARD 字 符 时 设置 此 标志 ， 当 键入 另 一 个 DISCARD 字 符 时 ， 
此 标志 被 清除 。 设 置 或 清除 此 终端 标志 也 可 设置 或 清除 此 条 件 。 
(c_cflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 如 若 设 置 ， 
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ICANON 


ICRNL 


IEXTEN 


IGNBRK 


IGNCR 


IGNPAR 


IMAXBEL 
INLCR 


INPCK 


ISIG 


ISTRIP 


IUCLC 
IXANY 


IXOFF 


则 当 最 后 一 个 进程 关闭 此 设备 时 ， 调 制 解 调 器 控制 线 降 至 低 电 平 〈 也 就 是 
调制 解 调 器 的 连接 断 开 ) 。 

(c_lflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 如 若 设 置 ， 
则 按 规范 模式 工作 〈 见 18.10 节 )。 这 使 下 列 字符 起 作用 : EOF, EOL, EOL2, 
ERASE、KILL、REPRINT、STATUS 和 WERASE。 输 入 字符 被 装配 成 行 。 
如 果 不 以 规范 模式 工作 ， 则 读 请 求 直 接 从 输入 队列 取 字 符 。 在 至 少 接 到 
MIN 个 字 节 或 已 超过 TIME 值 之 前 ，read 将 不 返回 。 详 细 情 况 见 18.11 节 。 
(c_iflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 如 若 设置 
并 且 IGNCR 未 设置 ， 则 将 接收 到 的 CR 字符 转换 成 一 个 NL 字符 。 

(c_lflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 如 若 设 置 ， 
则 识别 并 处 理 扩充 的 、 实 现 定义 的 特殊 字符 。 

(c_iflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 在 设置 时 ， 
忽略 输入 中 的 BREAK 条 件 。 关 于 BREAK 条 件 是 产生 SIGINT 信 号 还 是 被 读 
作为 数据 ， 请 见 BRKINT。 

(c_iflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 如 若 设 置 ， 
忽略 接收 到 的 CR 字符 。 若 此 标志 未 设置 而 设置 了 ICRNL 标 志 ， 则 将 接收 到 
的 CR 字符 转换 成 一 个 NL 字符 。 

(c_iflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 在 设置 时 ， 
忽略 带 有 结构 错误 (JEBREAK) 或 奇偶 错 的 输入 字 节 。 

(c_iflag, FreeBSD, Linux, Mac OS X, Solaris) 当 输 入 队列 满 时 响 铃 。 
(c_iflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 如 若 设 置 ， 
则 将 接收 到 的 NL 字 符 转换 成 CR 字符 。 

(c_iflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 当 设 置 时 ， 
使 输入 奇偶 校 验 起 作用 。 如 若 未 设置 INPCK， 则 使 输入 奇偶 校 验 不 起 作用 。 
奇偶 “产生 和 检测 ”和 “输入 奇偶 性 检验 ”是 不 同 的 两 件 事 。 奇 偶 位 的 产 
生 和 检测 是 由 PARENB 标 志 控 制 的。 设置 该 标志 后 使 串 行 接口 的 设备 驱动 
程序 对 输出 字符 产生 奇偶 位 ， 对 输入 字符 则 验证 其 奇偶 性 。 标 志 PARODD 
决定 该 奇偶 性 应 当 是 奇 还 是 偶 。 如 果 一 个 到 来 的 字符 其 奇偶 性 为 错 的 ， 则 
检查 INPCK 标 志 的 状态 。 若 此 标志 已 设置 ， 则 检查 IGNPAR 标 志 (URE 
是 否 应 忽略 带 奇 偶 错 的 输入 字 节 )， 若 不 应 忽略 此 输入 字 节 ， 则 检查 
PARMRK 标 志 以 决定 向 读 进程 应 传送 那些 字符 。 

(c_lflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 如 若 设 置 ， 
则 判别 输入 字符 是 否 是 要 产生 终端 信号 的 特殊 字符 (INTR, QUIT, SUSP 
和 DSUSP)， 若 是 ， 则 产生 相应 信号 。 

(c_iflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 当 设 置 时 ， 
有 效 输 入 字 节 被 剥离 为 7 位 。 当 此 标志 未 设置 时 ， 则 保留 全 部 8 位 。 
(c_iflag, Linux, Solaris) 将 输入 的 大 写字 符 映 射 为 小 写字 符 。 
(c_iflag, XSI, FreeBSD, Linux, Mac OS X, Solaris) 使 任 一 字符 都 能 
重新 启动 输出 。 

(c_iflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 如 若 设置 ， 
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IXON 


MDMBUF 


NLDLY 
NOFLSH 


NOKERNINFO 


OCRNL 


OFDEL 


OFILL 


OLCUC 
ONLCR 


ONLRET 


ONOCR 
ONOEOT 


OPOST 


OXTABS 
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则 使 启动 -停止 输入 控制 起 作用 。 当 终端 驱动 程序 发 现 输入 队列 将 要 填 满 
时 ， 输 出 一 个 STOP 字 符 。 此 字符 应 当 由 发 送 数据 的 设备 识别 ， 并 使 该 设备 
暂停 。 此 后 ， 当 已 对 输入 队列 中 的 字符 进行 了 处 理 后 ， 该 终端 驱动 程序 将 
输出 一 个 STARTI 字 符 ， 使 该 设备 恢复 发 送 数据 。 

(c_iflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 如 若 设置 ， 
则 使 启动 -停止 输出 控制 起 作用 。 当 终端 驱动 程序 接收 到 一 个 STOP 字 符 时 ， 
输出 暂停 。 在 输出 暂停 时 ， 下 一 个 START 字 符 恢复 输出 。 如 车 未 设置 此 标 
志 ， 则 START 和 STOP 字 符 由 进程 读 作 为 一 般 字符 。 

(c_cflag, FreeBSD, Mac OS X) 按照 调制 解 调 器 的 载波 标志 进行 输出 
流 控制 。 这 是 CCAR_OFLOW 标 志 的 曾 用 名 。 

(c_oflag, XSI, Linux, Solaris) 换行 延迟 屏蔽 。 此 屏蔽 的 值 是 NL0 和 NL1。 
(c lflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 按 系 统 默 
认 ， 当 终端 驱动 程序 产生 SIGINT 和 SIGQUIT 信 号 时 ， 输 入 、 输 出 队列 都 
被 刷新 。 另 外 ， 当 它 产 生 SIGSUSP 信 号 时 ， 输 入 队列 被 刷新 。 如 若 设置 了 
NOFLSH 标 志 ， 则 在 这 些 信 号 产生 时 ， 不 对 输入 、 输 出 队列 进行 刷新 。 
(c_lflag, FreeBSD, Mac OS X) 当 设 置 时 ， 此 标志 防止 STATUS 字符 把 
前 台 进 程 组 的 状态 信息 显示 在 终端 上 。 但 是 不 论 本 标志 是 否 设置 ， 
STATUS 字符 使 SIGINFO 信 号 送 至 前 台 进 程 组 中 的 所 有 进程 。 

(c_oflag, XSI, FreeBSD, Linux, Solaris) 如 若 设置 ， 将 输出 的 CR 字 
符 映 射 为 NL。 

(c_oflag, XSI, Linux, Solaris) 如 车 设 置 ， 则 输出 填充 字符 是 ASCII 
DEL， 否 则 它 是 ASCIIL NUL。 参 见 OFILL 标 志 。 

(c_oflag, XSI, Linux, Solaris) 如 若 设 置 ， 则 为 了 实现 延迟 ， 发 送 填充 
字符 (ASCH DEL 或 ASCII NUL， 参 见 OFDEL 标 志 ) ， 而 不 使 用 时 间 延 迟 。 
参见 如 下 6 个 延迟 屏蔽 标志 : BSDLY, CRDLY, FFDLY, NLDLY, TABDLY 
以 及 VTDLY。 

(c_oflag, Linux, Solaris) 如 若 设置 ， 将 输出 的 小 写字 符 映 射 为 大 写 。 
(c_oflag, XSI, FreeBSD, Linux, Mac OS X, Solaris) 如 若 设置 ， 将 输 
出 的 NL 字 符 映射 为 CR-NL。 

(c_oflag, XSI, FreeBSD, Linux, Solaris) 如 若 设 置 ， 则 输出 的 NL 字 
符 应 该 执行 回 车 功能 。 

(c_oflag, XSI, FreeBSD, Linux, Solaris) 如 若 设置 ， 则 在 0 列 不 输出 CR 。 
(c oflag, FreeBSD, Mac OS X) 如 若 设置 ， 则 在 输出 中 删除 EOT 字 符 
(^D)。 在 将 Ctrl+D 解 释 为 挂 断 的 终端 上 这 可 能 是 需要 的 。 

(c_oflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 如 若 设置 ， 
则 进行 实现 定义 的 输出 处 理 。 关 于 c_oflag 字 的 各 种 实现 定义 的 标志 ， 见 
表 18-4。 

(c_oflag, FreeBSD, Mac OS X) 如 若 设置 ， 制 表 符 在 输出 中 被 扩展 为 
空格 。 这 与 将 水 平 制 表 延 迟 (TABDLY) 设置 为 XTABS 或 TAB3 产 生 的 效果 
相同 。 
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PARENB 


PAREXT 


PARMRK 


PARODD 


PENDIN 


TABDLY 


TOSTOP 


VTDLY 


XCASE 


(c_cflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 如 若 设 置 ， 
则 对 输出 字符 产生 奇偶 位 ， 对 输入 字符 则 执行 奇偶 性 检验 。 若 PARODD 已 
设置 ， 则 奇偶 校 验 是 奇 校 验 ， 否 则 是 偶 校 验 。 参 见 对 INPCK、IGNPAR 和 
PARMRK 标 志 的 讨论 。 

(c_cflag, Solaris) 选择 标记 或 空 奇偶 性 。 若 PARODD 设 置 ， 则 奇偶 位 总 
是 1 (标记 奇偶 性 ) ， 否则 奇偶 位 总 是 0 ( 空 奇偶 性 )。 

(c_iflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 当 设 置 时 ， 
如 果 IGNPRAR 未 设置 ， 则 结构 性 错 (JEBREAK) 或 奇偶 错 的 字 节 由 进程 读 
作为 三 个 字符 序列 \377，\0 和 X， 其 中 X 是 接收 到 的 具有 错误 的 字 节 。 如 
车 ISTRIP 未 设置 ， 则 一 个 有 效 的 \377 被 传送 给 进程 时 为 \377,\377。 如 
车 IGNPAR 和 PARMRK 都 未 设置 ， 则 结构 性 错 或 奇偶 错 的 字 节 都 被 读 作为 一 
个 字符 \0。 
(c_cflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) Anz iu, 
则 输出 和 输入 字符 的 奇偶 性 都 是 奇 ， 否则 为 偶 。 注 意 ，PARENB 标 志 控 制 
奇偶 性 的 产生 和 检测 。 

当 CMSPAR 或 PAREXT 标 志 设 置 时 ，PARODD 标 志 也 控制 是 否 使 用 标记 或 空 
格 的 奇偶 性 。 

(c_lfiag, FreeBSD, Linux, Mac OS X, Solaris) 如 若 设 置 ， 则 在 下 一 
个 字符 输入 时 ， 尚 未 读 的 任何 输入 都 由 系统 重新 打印 。 这 一 动作 与 键入 
REPRINT 字 符 时 的 作用 相 类 似 。 

(c_oflag, XSI, Linux, Solaris) 水 平 制 表 延迟 屏蔽 标志 。 此 屏蔽 标志 的 
值 是 TAB0、TAB1、TAB2 或 TAB3 。 

XTABS 的 值 等 于 TAB3。 此 值 使 系统 将 制 表 符 扩展 成 空格 。 系 统 假定 制 表 符 
在 屏幕 上 每 8 个 空格 处 设置 一 个 。 我 们 不 能 更 改 此 假定 。 

(c_lflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 如 若 设置 ， 
并 且 该 实现 支持 作业 控制 ， 则 将 信号 SIGTTOU 送 到 试图 写 控制 终端 的 一 个 
后 台 进 程 的 进程 组 。 按 默认 ， 此 信和 号 暂停 该 进程 组 中 所 有 进程 。 如 果 写 控 
制 终端 的 进程 忽略 或 阻塞 此 信号 ， 则 终端 驱动 程序 不 产生 此 信和 号 。 
(c_oflag, XSI, Linux, Solaris) 垂直 制 表 延 迟 屏蔽 标志 。 此 屏蔽 标志 的 
值 是 VT0 或 VT1。 

(c_lflag, Linux, Solaris) 如 若 设 置 ， 并 且 ICANON 也 设置 ， 则 认为 终端 
只 是 大 写 终端 ， 所 有 输入 都 变换 为 小 写 。 为 了 输入 一 个 大 写字 符 ， 须 在 其 
前 加 一 个 \。 与 之 类 似 ， 输 出 一 个 大 写字 符 也 在 其 前 加 一 个 \。( 这 一 标志 
如 今 已 经 过 时 ， 现 在 几乎 所 有 终端 都 支持 大 、 小 写字 符 。) 


18.6 stty 命 令 


上 节 说 明 的 所 有 选项 ， 在 程序 中 都 可 用 tcgetattr 和 tcsetattr 函 数 ( 见 18.4 节 ) 进行 
检查 和 更 改 。 在 命令 行 (或 shell 脚 本 ) 中 则 可 用 stty(1) 命 令 进行 检查 和 更 改 。stty(1) 命 令 是 
表 18-5 中 所 列 的 前 6 个 函数 的 接口 。 如 果 以 -a 选项 执行 此 命令 ， 则 显示 终端 的 所 有 选项 ; 
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$ stty -a 

speed 9600 baud; 25 rows; 80 columns; 

lflags: icanon isig iexten echo echoe -echok echoke -echonl echoctl 
-echoprt -altwerase -noflsh -tostop -flusho pendin -nokerninfo 
-extproc 

iflags: -istrip icrnl -inlcr -igncr ixon -ixoff ixany imaxbel -ignbrk 
brkint -inpck -ignpar -parmrk 

oflags: opost onlcr -ocrnl -oxtabs -onocr -onlret 

cflags: cread cs8 -parenb -parodd hupcl -clocal -cstopb -crtscts 
-dsrflow -dtrflow -mdmbuf 

cchars: discard = ^O; dsusp = ^Y; eof = ^D; eol = <undef>; 


eol2 - «undef»; erase - ^H; erase2 - ^?; intr - ^C; kill - ^U; 
lnext - ^V; min - 1; quit - ^; reprint - ^R; start - ^Q; 
Status - ^T; stop - ^S; susp - ^Z; time - 0; werase - ^W; 


选项 名 前 若 有 连 字 符 ， 则 表示 该 选项 禁用 。 最 后 四 行 显示 各 终端 特殊 字符 的 当前 设置 ( 见 18.3 
节 )。 第 1 行 显示 当前 终端 窗口 的 行 数 和 列 数 ，18.12 节 将 对 此 进行 讨论 。 


Sty 使 用 标准 输入 获得 和 设置 终 山 的 选项 标志 。 虽 然 ， 某 些 较 早 的 实现 使 用 标准 输出 ， 但 
POSIX-I 和 要 来 使 用 标准 输入 。 本 书 讨论 的 四 种 实现 都 提供 了 在 标准 输入 上 操作 的 sEEy 版 本 。 这 意味 着 
如 果 我 希望 了 解 名 为 ttyla 终 说 的 设置 ， 那么 我 们 可 以 键入 

stty -a </dev/ttyla 


18.7 RREAK 


BAA (baud rate) 是 一 个 以 往 采 用 的 术语 ， 现 在 它 指 的 是 “位 / 秒 ”(bits per second), R 
然 大 多 数 终端 设备 对 输入 和 输出 使 用 同一 波 特 率 ， 但 是 只 要 硬件 许可 ， 可 以 将 它们 设置 为 两 个 
不 同 值 。 

#include <termios.h> 

speed t cfgetispeed(const struct termios *termptr) ; 


speed_t cfgetospeed(const struct termios *termptr) ; 


两 个 函数 的 返回 值 : 波 特 率 值 


int cfsetispeed(struct termios *termptr, speed_t speed) ; 


int cfsetospeed(struct termios *fermptr, speed_t speed); 


两 个 函数 的 返回 值 ， 若 成 功 则 返回 9?， 若 出 错 则 返回 一 1 





两 个 cfget 函 数 的 返回 值 ， 以 及 两 个 cfset 函 数 的 speed 参 数 都 是 下 列 常量 之 一 :B50、B75、 
B110, B134, B150, B200, B300, B600、B1200、B1800、B2400、B4800、B9600、 
B19200 或 B38400。 常 量 B0 表 示 “ 挂 断 ”。 在 调用 tcsetattr 时 ， 如 若 将 输出 波 特 率 指定 为 
B0， 则 调制 解 调 器 的 控制 线 就 不 再 起 作用 。 


大 多 数 系统 定义 了 另外 的 波 特 率 值 ， 例 如 B57600 以 及 B115200 。 


使 用 这 些 函 数 时 ,应当 理解 输入 、 输出 波 特 率 是 存放 在 图 18-3 所 示 的 设备 termios 结 构 中 的 。 
在 调用 任 一 cfget 函 数 之 前 ， 先 要 用 tcgetattr 获 得 设备 的 termios 结 构 。 与 此 类 似 ， 在 调用 
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任 一 cfset 函 数 后 ， 应 将 波 特 率 设置 到 termios 结 构 中 。 为 使 这 种 更 改 影响 到 设备 ， 应 当 调用 
tcsetattr 函 数 。 如 果 所 设置 的 波 特 率 有 错 ， 则 在 调用 tcsetattr 之 前 ， 不 会 发 现 这 种 错误 。 

这 4 个 波 特 率 函数 使 应 用 程序 不 必 考 虑 具体 实现 在 termios 结 构 中 表示 波 特 率 的 不 同方 法 。 
BSD 派 生 的 平台 趋向 于 存放 波 特 率 的 数值 (例如 9600 波 特 就 存放 为 9600) ， 同 时 Linux 和 系统 V 
派生 的 平台 趋向 于 以 位 屏 项 方式 表示 波 特 率 。 从 cfget 函数 得 到 的 以 及 向 cfset 传 送 的 速度 值 
与 它们 存放 在 termios 结 构 中 的 一 样 。 


18.8 行 控制 函数 


下 列 4 个 函数 提供 了 终端 设备 的 行 控制 能 力 。 其 中 ， 参 数 filedes 引 用 一 个 终端 设备 ， 否 则 出 
错 返 回 ，errno 设 置 为 ENOTTY，。 


#include <termios.h> 
int tcdrain(int filedes) ; 


int tcflow(int filedes, int action) ; 


int tcflush(int filedes, int queue); 


int tcsendbreak(int filedes, int duration); 


四 个 函数 返回 值 ， 车 成 功 则 返回 0， 若 出 错 则 返回 -1 


tcdrain 函 数 等 待 所 有 输出 都 被 发 送 。tcf1low 用 于 对 输入 和 输出 流 控 制 进行 控制 。 
action 参 数 应 当 是 下 列 四 个 值 之 一 。 

TCOOFF 输出 被 挂 起 。 

TCOON 重新 启动 以 前 被 挂 起 的 输出 。 

TCIOFF 系统 发 送 一 个 STOP 字 符 。 这 将 使 终端 设备 暂停 发 送 数据 。 

TCION 系统 发 送 一 个 START 字 符 。 这 将 使 终端 恢复 发 送 数据 。 

tcflush 函 数 制 清 (WF) 输入 缓冲 区 或 输出 缓冲 区 。 输 入 缓冲 区 中 的 数据 是 终端 驱动 程 
序 已 接收 到 ， 但 用 户 程序 尚未 读 的 ， 输 出 缓冲 区 中 的 数据 是 用 户 程 序 已 经 写 ， 但 尚未 发 送 的 。 
queue 参 数 应 当 是 下 列 三 个 常量 之 一 : 

TCIFLUSH ” 刷 清 输 入 队列 。 

TCOFLUSH ” 刷 清 输出 队列 。 

TCIOFLUSH 刷 清 输 入 、 输 出 队列 。 

tcsendbreak 函 数 在 一 个 指定 的 时 间 区 间 内 发 送 连续 的 0 位 流 。 若 duration 参 数 为 0， 则 此 
种 发 送 延 续 0.25 至 0.5 秒 之 闻 。POSIX.1 说 明 若 duration 非 0， 则 发 送 时 间 依 赖 于 实现 。 


18.9 终端 标识 


历史 沿 柳 至今， 在 大 多 数 UNIX 系 统 中 ， 控 制 终端 的 名 字 是 /dev/tty。POSIX.1 提 供 了 一 
个 运行 时 函数 ， 可 被 用 来 确定 控制 终端 的 名 字 。 


#include <stdio.h> 





char *ctermid(char *ptr) ; 


返回 值 ; 车 成 功 则 返回 指向 控制 终端 名 的 指针 ， 若 出 错 则 返回 指向 空 字符 串 的 指针 
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如 果 ptr 非 null， 则 它 被 认为 是 一 个 指针 ， 指 向 长 度 至 少 为 L_ctermid 字 节 的 数组 ， 进 程 的 
控制 终端 名 存放 在 该 数组 中 。 常 量 L_ctermid 定 义 在 <stdio.h> 中 。 若 ptr 是 一 个 空 指 针 ， 则 
该 函数 为 数组 (通常 作为 静态 变量 ) 分 配 空间 。 同 样 ， 进 程 的 控制 终端 名 存放 在 该 数组 中 。 

在 这 两 种 情况 中 ， 该 数组 的 起 始 地 址 被 作为 函数 值 返 回 。 因 为 大 多 数 UNIX 系 统 都 使 用 
/dev/tty 作 为 控制 终端 名 ， 所 以 此 函数 的 主要 作用 是 帮助 提高 向 其 他 操作 系统 的 可 移植 性 。 


当 调 用 ctermid 吕 数 时 ， 本 书 说 明 的 所 有 四 种 平台 都 返回 字符 事 /dev/tty。 


RG. ctermidhA 
程序 清单 18-3 是 POSIX.1 ctermid 函 数 的 一 个 实现 。 


程序 清单 18-3 POSIX.1 ctermid 函 数 的 实现 


#include <stdio.h> 
#include <string.h> 


Static char ctermid name[L ctermid] ; 


char * 
ctermid(char *str) 


if (str == NULL) 
Str - ctermid name; 
return(strcpy(str, "/dev/tty")); /* strcpy() returns str */ 


) 





注意 ， 因 为 我 们 无 法 确定 调用 者 的 缓冲 区 大 小 ， 所 以 也 就 不 能 防止 过 度 使 用 该 缓冲 区 。 口 

另外 两 个 与 终端 标识 有 关 的 函数 是 isatty 和 ttyname。 前 者 在 文件 描述 符 引 用 一 个 终端 
设备 时 返回 真 ， 而 后 者 则 返回 在 该 文件 描述 符 上 打开 的 终端 设备 的 路 径 名 。 

#include «unistd.h» 


int isatty (int filedes) ; 


返回 值 : 若 为 终端 设备 则 返回 1 ( 真 )， 和 否则 返回 0 (f&) 


char *ttyname (int filedes) ; 


返回 值 : 指向 终端 路 径 名 的 指针 ， 若 出 错 则 返回 NULL 





Sj. isatty 函 数 ~ 
如 程序 清单 18-4 所 示 ，i satty 函 数 很 容易 实现 。 其 中 只 使 用 了 一 个 终端 专用 的 函数 
tcgetattr (如 果 成 功 执行 ， 它 不 改变 任何 东西 ) ， 并 取 其 返回 值 。 


程序 清单 18-4 POSIX.1 ieatty 函 数 的 实现 
#include <termios.h> 


int 
isatty(int fd) 


struct termios ts; 
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return(tcgetattr(fd, &ts) != -1); /* true if no error (is a tty) */ 


} 





用 程序 清单 18-5 中 的 程序 测试 isatty 国 数 。 
程序 清单 18-5 测试 ieatty 函 数 


#include "apue .hn 


int 

main (void) 

{ 
printf ("fd 0: $sWn", isatty(0) ? "tty" : "not a tty"); 
printf("fd 1: %s\n", isatty(1) 2 "tty" : "not a tty"); 
printf ("fd 2: $sWn", isatty(2) ? "tty" : "not a tty"); 
exit(0); 


当 运 行程 序 清单 18-5 中 的 程序 时 ， 我 们 可 以 得 到 下 面 的 结果 : 


$ ./a.out 
fd 0: tty 
fd l:Jtty 
fd 2: tty 


$ ./a.out «/etc/pamswd 2>/dev/null 
fd 0: not a tty 

fd 1: tty 

fd 2: not a tty 


ttynamerA 〈 见 程序 清单 18-6) 比较 长 ， 因 为 它 要 搜索 所 有 设备 表 项 ， 寻 找 匹 配 项 。 
程序 清单 18-6 POSIX.1 ttyname 函 数 的 实现 





#include <sys/stat.h> 
#include «dirent.h» 
include «limits.h» 
#include <string.h> 
#include «termios.h» 
include «unistd.h» 
#include <stdlib.h> 


struct devdir { 
struct devdir *d_next; 


char *d_name; 
}; 
static struct devdir *head; 
static struct devdir *tail; 
static char pathname[ POSIX PATH MAX + 1]; 


Static void 
add(char *dirname) 


{ 


struct devdir *ddp; 
int len; 


len = strlen(dirname) ; 


/* 
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* Skip ., .., and /dev/fd. 
*/ 
if ((dirname[len-1] == '.') && (dirname [len-2] == '/' || 
(dirname [len-2] == '.' && dirname[len-3] == '/'))) 
return; 
if (strcmp(dirname, "/dev/fd") == 0) 
return; 


ddp = malloc (sizeof (struct devdir)); 
if (ddp == NULL) 
return; 


ddp->d_name = strdup (dirname) ; 
if (ddp-»d name == NULL) { 
free (ddp); 
return; 
} 
ddp->d_next = NULL; 
if (tail == NULL) { 


head = ddp; 
tail = ddp; 
} else { 
tail->d_next = ddp; 
tail = ddp; 


static void 
cleanup (void) 


{ 


} 


struct devdir *ddp, *nddp; 


ddp = head; 

while (ddp != NULL) { 
nddp = ddp-»d next; 
free (ddp->d_name) ; 
free (ddp) ; 
ddp = nddp; 

} 

head 

tail 


NULL; 
NULL; 


static char * 
searchdir(char *dirname, struct stat *fdstatp) 


{ 


struct stat devstat; 
DIR *dp; 
int devlen; 


struct dirent *dirp; 


strcpy(pathname, dirname); 

if ((dp = opendir(dirname)) == NULL) 
return (NULL) ; 

strcat (pathname, "/"); 

devlen = strlen (pathname) ; 

while ((dirp = readdir(dp)) != NULL) { 
strncpy (pathname + devlen, dirp->d_name, 

_POSIX_PATH MAX - devlen); 


/* 
* Skip aliases. 


*/ 
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if (stremp(pathname, "/dev/stdin") == 0 || 
strcmp(pathname, "/dev/stdout") == 0 || 
strcmp (pathname, "/dev/stderr") == 0) 
continue; 
if (stat (pathname, &devetat) < 0) 
continue; 
if (S_ISDIR(devstat.st_mode)) { 
add (pathname) ; 
continue; 
if (devstat.st_ino == fdstatp->st_ino && 
devstat.st_dev == fdstatp->st_dev) { /* found a match */ 


closedir (dp); 
return (pathname) ; 
} 
} 


closedir (dp); 
return (NULL) ; 


} 


char * 
ttyname(int fd) 


struct stat fdstat; 
struct devdir *ddp; 
char *rval; 
if (isatty(fd) == 0) 


return (NULL) ; 

if (fstat(fd, &fdstat) « 0) 
return (NULL); 

if (8 ISCHR(fdstat.st mode) == 0) 
return(NULL); 


rval = searchdir("/dev", &fdstat); 
if (rval -- NULL) ( 
for (ddp - head; ddp !- NULL; ddp - ddp-»d next) 
if ((rval = searchdir(ddp-»d name, &fdstat)) !- NULL) 
break; 


) 


cleanup(); 
return (rval); 


} 


此 处 用 到 的 方法 是 读 /dev 目 录 ， 寻找 具有 相同 设备 号 和 i 节点 编号 的 表 项 。 回 忆 4.23 节 ， 


每 个 文件 系统 有 一 个 唯一 的 设备 号 (stat 结 构 中 的 st_dev 字 段 ， 见 4.2 节 )， 文 件 系 统 中 的 每 
个 目录 项 有 一 个 唯一 的 i 节点 号 (stat 结 构 中 的 st_ino 字 段 )。 在 此 函数 中 假定 当 找 到 一 个 匹 
配 的 设备 号 和 匹配 的 i 节点 号 时 ， 就 找到 了 所 希望 的 目录 项 。 也 可 验证 这 两 个 表 项 与 st_rdev 
字段 (终端 设备 的 主 、 次 设备 号 ) 相 匹 配 ， 以 及 该 目录 项 是 一 个 字符 特殊 文件 。 但 是 ， 因 为 已 
经 验证 了 文件 描述 符 参 数 是 一 个 终端 设备 以 及 一 个 字符 特殊 设备 ， 而 且 在 UNIX 系 统 中 ， 匹 配 
的 设备 号 和 i 节点 号 是 唯一 的 ， 所 以 不 再 需要 作 另 外 的 比较 。 

我 们 的 终端 名 可 能 在 /dev 的 子 目录 中 。 于 是 ， 需 要 搜索 在 /dev 之 下 的 整个 文件 系统 子 树 。 
我 们 跳 过 了 很 多 会 产生 不 正确 或 奇怪 结果 的 目录 ， 它 们 是 /Gev/ .、/dev/ . .和 /dev/fd。 我 
们 也 跳 过 了 一 些 别 名 , 即 /dev/stdin、/dev/stdout 以 及 /dev/stderr， 它 们 是 对 在 
/dev/fd 目 录 中 文件 的 符号 链接 。 
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用 程序 清单 18-7 测 试 这 一 实现 。 
程序 清单 18-7 MistttynamemA 


#include "apue.h" 
int 
main (void) 


char *name; 


if (isatty(0)) { 
name - ttyname(0); 
if (name == NULL) 
name = "undefined"; 
) else { 
name = "not a tty"; 


printf ("fd 0: %s\n", name); 
if (isatty(1)) { 
name = ttyname (1); 
if (name == NULL) 
name = "undefined"; 
} else { 
name = "not a tty"; 


printf ("fd 1: %s\n", name); 
if (isatty(2)) { 
name - ttyname(2); 
if (name == NULL) 
name - "undefined"; 
) else { 
name = "not a tty"; 


printf ("fd 2: %s\n", name); 


exit (0); 
} 
运行 该 程序 得 到 
$ ./a.out < /dev/console 2» /dev/null 
fd 0: /dev/console 
fd 1: /dev/ttyp3 
fd 2: not a tty O 


18.10 规范 模式 
规范 模式 很 简单 : 发 一 个 读 请 求 ， 输 入 完 一 行 后 ， 终 端 驱动 程序 即 返回 。 下 列 几 个 条 件 都 
会 造成 读 返 回 。 

。 所 要 求 的 字 节 数 已 读 到 时 ， 读 返回 。 无 需 读 一 个 完整 的 行 。 如 果 读 了 部 分 行 ， 那 么 也 不 
会 丢失 任何 信息 ， 下 一 次 读 从 前 一 次 读 的 停止 处 开始 。 

。 当 读 到 一 个 行 定 界 符 时 , BRE. 回忆 18.3 节 , 在 规范 模式 中 下 列 字符 被 解释 为 “ 行 结束 ”， 
NL、EOL、EOL2 和 EOF。 另 外 ， 在 18.5 节 中 也 曾 说 明 ， 如 车 已 设置 TCRNL， 但 未 设置 
IGNCR， 则 CR 字符 的 作用 与 NL 字符 一 样 ， 所 以 它 也 终止 一 行 。 

在 这 5 个 行 定 界 符 中 ， 其 中 只 有 一 个 EOF 字 符 在 终端 驱动 程序 对 其 进行 处 理 后 即 被 删除 。 
其 他 4 个 字符 则 作为 该 行 的 最 后 一 个 字符 返回 给 调用 者 。 
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“ 如 果 捕捉 到 信号 而 且 该 函数 并 不 自动 重启 动 ( 见 10.5 节 )， 则 读 也 返回 。 
实例 :getpass 函 数 


下 面 说明 getpass 函 数 ， 它 读 入 用 户 在 终端 上 键入 的 口令 。 此 函数 由 UNIX 1ogin(1) 和 
crypt(1) 程 序 调 用 。 为 了 读 口 令 ， 该 函数 必须 禁止 回 显 ， 但 仍 可 使 终端 以 规范 模式 进行 工作 ， 
因为 用 户 在 键入 口令 后 ,一 定 要 键入 回 车 ， 这 样 也 就 构成 了 一 个 完整 行 。 程 序 清单 18-8 是 一 个 
典型 的 UNIX 实 现 。 


程序 清单 18-8 getpass 函 数 的 实现 





#include <signal .h> 

#include <stdio.h> 

#include «termios.h» 

define MAX PASS LEN 8 /* max #chars for user to enter */ 
Char * 


getpass(const char *prompt) 


Static char buf[MAX PASS LEN + 1]; /* null byte at end */ 
char *ptr; 

Sigset t Sig, osig; 

Struct termios ts, ots; 

FILE *fp; 

int Cc; 

if ((fp - fopen(ctermid(NULL), "r«")) -- NULL) 


return (NULL); 
setbuf (fp, NULL); 


sigemptyset (&sig) ; 


sigaddset (&sig, SIGINT); /* block SIGINT */ 
Sigaddset(&sig, SIGTSTP) ; /* block SIGTSTP */ 
sigprocmask (SIG BLOCK, &sig, &osig); /* and save mask */ 
tcgetattr(fileno(fp), &ts); /* save tty state */ 

ots = ts; /* structure copy */ 


ts.c lflag &- ^(ECHO | ECHOE | ECHOK | ECHONL); 
tcsetattr(fileno(fp), TCSAFLUSH, &ts); 
fputs (prompt, fp); 


ptr = buf; 
while ((c = getc(fp)) != EOF && C != ‘\n’) 
if (ptr < &buf[MAX PASS LEN]) 
*ptr++ = C; 
*ptr = 0; /* null terminate */ 
putc('\n', fp); /* we echo a newline */ 


tcsetattr(fileno(fp), TCSAFLUSH, &ots); /* restore TTY state */ 
Sigprocmask(SIG SETMASK, &osig, NULL); /* restore mask */ 
fclose (fp); /* done with /dev/tty */ 

return (buf) ; 


} 


在 此 例 中 ， 有 很 多 方面 应 当 考 虑 ; 

* 调用 ctermigd 函 数 打开 控制 终端 ， 而 不 是 直接 将 /dev/tty 写 在 程序 中 。 

“ 只 是 读 、 写 控制 终端 ， 如 果 不 能 以 读 、 写 模式 打开 此 设备 则 出 错 返 回 。 在 有 些 系统 中 也 
使 用 一 些 其 他 约定 。 在 BSD 中 ， 如 果 不 能 以 读 、 写 模式 打开 控制 终端 ， 则 getpass 从 标 
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准 输 入 读 ， 写 到 标准 出 错 文件 中 。 系 统 V 版 本 则 总 是 写 到 标准 出 错 文件 中 ， 但 只 从 控制 终 
端 读 。 

* 阻塞 两 个 信号 STGINT 和 SIGTSTP。 如 果 不 这 样 做 ， 则 在 输入 INTR 字 符 时 就 会 使 程序 终 
止 ， 并 使 终端 仍 处 于 禁止 回 显 状 态 。 与 此 相关 似 ， 输 入 SUSP 字 符 时 将 使 程序 暂停 ， 并 且 
在 禁止 回 显 状态 下 返回 到 shell。 在 禁止 回 显 时 ， 选 择 了 阻塞 这 两 个 信号 。 在 读 口令 期 间 如 1550 
果 发 生 了 这 两 个 信号 ， 则 它们 被 保持 ， 直 到 getpass 返 回 前 才 解 除 对 它们 的 阻塞 。 也 有 
其 他 方法 来 处 理 这 些 信 号 。 某 些 getpass 版 本 忽略 SIGINT (保存 它 以 前 的 动作 ) ， 在 返 
回 前 则 将 其 动作 恢复 为 以 前 的 值 。 这 就 意味 着 在 该 信号 被 忽略 期 间 所 发 生 的 这 种 信号 都 
丢失 。 其 他 版 本 捕捉 SIGINT (保存 它 以 前 的 动作 ) ， 如 果 捕 提 到 此 信号 ， 则 在 复 置 终端 
状态 和 信号 动作 后 ， 用 ki11 函数 发 送 此 信和 号。 没有 一 个 getpass 版 本 捕 提 、 忽 咯 或 阻塞 
SITGQUIT， 所 以 键 人 QUIT 字 符 就 会 使 程序 天 折 ， 并 且 终 端 极 可 能 仍 处 于 禁止 回 显 状态 。 

“请 注意 ， 某 些 shell (例如 Korn shell) 在 以 交互 方式 读 输 入 时 都 使 终端 处 于 回 显 状态 。 这 
些 sheii 是 提供 命令 行 编辑 的 shell， 因 此 在 每 次 输入 一 条 交互 命令 时 都 处 理 终 端 状 态 。 所 
以 如 果 在 这 种 shell 下 调用 此 程序 ， 并 且 用 QUIT 字 符 使 其 天 折 ， 则 这 种 sheli 可 以 恢复 回 显 
状态 。 不 提供 命令 行 编辑 的 shell (例如 Bourne sheli) 将 使 程序 天 折 ， 并 使 终端 仍 处 于 不 
回 显 状态 。 如 果 对 终端 做 了 这 种 操作 ， 则 stty 命 令 能 使 终端 回复 到 回 显 状态 。 

。 我 们 使 用 标准 WO 读 、 写 控制 终端 。 我 们 特地 将 流 设置 为 不 带 缓冲 的 ， 否 则 在 流 的 读 、 写 
之 间 可 能 会 有 某 些 相互 作用 (这 样 就 需 调 用 fflush)。 也 可 使 用 不 带 缓冲 的 IO ( 见 第 3 
X), 但 是 在 这 种 情况 下 就 要 用 read 来 实现 getc。 

。 最 多 只 存储 8 个 字符 作为 口令 。 输 入 的 多 余 字 符 则 被 忽略 。 

程序 清单 18-9 调 用 getpass 并 且 打 印 出 我 们 的 输入 。 这 是 为 了 验证 ERASE 和 KILL 字 符 是 

BERLE (如 同 它们 在 规范 模式 下 所 应 该 的 那样 )。 
程序 清单 18-9 调用 getpass 函 数 

#include "apue.h" 

char *getpass (const char *); 

int 

main (void) 

char *ptr; 
if ((ptr = getpass ("Enter password:")) == NULL) 


err Sys("getpass error"); 
printf("password: $sWn", ptr); 


/* now use password (probably encrypt it) ... */ 
while (*ptr != 0) 
*ptr++ = 0; /* zero it out when we're done with it */ 
exit(0); 
(0) [662] 


WHogetpassA AHETZE ATRSEL, MAREK RAAB mE 
文 口令 的 存储 区 。 如 果 该 程序 会 产生 其 他 用 户 能 读 的 core 文 件 ， 或 者 如 果 某 个 其 他 进程 能 够 
设法 读 该 进程 的 存储 空间 ， 则 它们 就 能 读 到 这 种 明文 口令 。( 我 们 用 “明文 ”表示 在 getpass 
输出 的 提示 符 后 输入 的 密码 。 多 数 UNIX 系 统 会 把 此 明文 密码 改 成 “加 密 ” 密 码 。 例 如 ， 密 码 
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文件 中 的 pw_passwd 字 段 包含 的 就 是 加 密 密 码 ， 而 不 是 明文 密码 。) 加 


18.11 非 规范 模式 


关闭 tezmios 结 构 中 c_1flag 字 段 的 ICANON 标 志 就 使 终端 处 于 非 规范 模式 。 在 非 规范 模 
式 中 ， 输 入 数据 并 不 组 成 行 ， 不 处 理 下 列 特殊 字符 (参见 18.3 节 ): ERASE, KILL, EOF, NL. 
EOL、EOL2、CR、REPRINT、 STAIUS 和 WERASE。 

如 前 所 述 ， 规 范 模 式 很 容易 : 系统 每 次 返回 一 行 。 但 在 非 规范 模式 下 ， 系 统 怎样 才能 知道 在 
什么 时 候 将 数据 返回 给 我 们 呢 ? 如 果 它 一 次 返回 一 个 字 节 ， 那 么 系统 开销 就 很 大 。 (回忆 表 3-2， 
从 中 可 以 看 到 每 次 读 一 个 字 节 的 开销 会 有 多 大 。 如 果 每 次 返回 的 数据 加 倍 ， 系 统 调用 的 开销 就 可 
减 半 。) 在 启动 读数 据 之 前 ， 往 往 不 知道 要 读 多 少数 据 ， 所 以 系统 不 能 总 是 一 次 返回 多 个 字 节 。 

解决 方法 是 : 当 已 读 了 指定 量 的 数据 后 ， 或 者 已 经 过 了 给 定 的 时 间 后 ， 即 通知 系统 返回 。 
这 种 技术 使 用 了 termios 结 构 中 c_cc 数 组 的 两 个 变量 MIN 和 TIME。c_cc 数 组 中 的 这 两 个 
元 素 的 下 标 名 为 VMIN 和 VTIME。 

MIN 说 明 一 个 read 返 回 前 的 最 小 字 节 数 。TIME 说 明 等 待 数据 到 达 的 分 秒 数 ( 秒 的 1/10 为 
分 秒 )。 有 下 列 四 种 情形 : 

情形 A: MIN >0, TIME>0 

TIME 说 明 字 节 间 的 计时 器 ， 在 接 到 第 一 个 字 节 时 才 启 动 它 。 在 该 计时 器 超时 之 前 ， 若 
已 接 到 MIN 个 字 节 ， 则 read 返 回 MIN 个 字 节 。 如 果 在 接 到 MIN 个 字 节 之 前 ， 该 计时 器 
已 超时 ， 则 read 返 回 已 接收 到 的 字 节 (因为 只 有 在 接 到 第 一 个 字 节 时 才 启 动 ， 所 以 在 
计时 器 超时 时 ， 至 少 返 回 了 1 个 字 节 )。 这 种 情形 中 ， 在 接 到 第 一 个 字 节 之 前 ， 调 用 者 
阻塞 。 如 果 在 调用 reaq 时 数据 已 经 可 用 ， 则 这 如 同 在 readq 后 数据 立即 被 接收 到 一 样 。 
情形 B: MIN >0, TIME == 
已 经 接 到 了 MIN 个 字 节 时 ，reaq 才 返回 。 这 可 以 造成 read 无 限期 地 阻塞 。 
情形 C: MIN ==0，TIME >0 
TIME 指 定 了 一 个 调用 read 时 启动 的 读 计 时 器 。( 与 情形 A 相 比 较 ， 两 者 是 不 同 的 。 在 
情形 A 中 ， 非 0 的 TIME 表 示 字 节 间 的 计时 器 ， 在 接 到 第 一 个 字 节 时 才 启 动 它 . ) 在 接 到 
1 个 字 节 或 者 该 计时 器 超时 时 ，read 即 返回 。 如 果 是 计时 器 超时 ， 则 read 返 回 0。 
情形 D: MIN ==0, TIME == 
如 果 有 数据 可 用 ， 则 read 最 多 返回 所 要 求 的 字 节 数 。 如 果 无 数据 可 用 ， 则 read 立即 
返回 0。 

在 所 有 这 些 情形 中 ，MIN 只 是 最 小 值 。 如 果 程 序 要 求 的 数据 多 于 MIN 个 字 节 ， 那 么 它 可 能 
接收 到 所 要 求 的 字 节 数 。 这 也 适用 于 MIN 为 0 的 情形 C 和 D。 

表 18-7 搞 要 列 出 了 非 规范 模式 输入 的 四 种 不 同情 形 。 在 图 中 ，nbytes 是 read 的 第 三 个 参数 
(返回 的 最 大 字 节 数 )。 


POSIX.1 尤 许 下 标 VMIN 和 VTIME 的 值 分 别 与 VEOF 和 VEOL 相 同 。 确 实 ，Solaris 就 是 这 样 做 的 。 这 样 
就 提供 了 与 系统 V 早 期 版 本 的 向 上 兼容 性 。 但 是 ， 这 也 带 来 了 可 移植 性 问题 。 从 非 规范 模式 转换 为 规 
范 模式 时 ， 必 须 恢 复 VEOF 和 VEOL， 如 果 不 这 样 做 ， 那么 VMIN 竺 于 VEOF， 并 且 它 已 被 设置 为 典型 值 1， 
于 是 文件 结束 字符 就 变 成 CtrltA。 解 决 这 一 问题 最 简单 的 方法 是 : 在 转 入 非 规范 模式 时 将 整个 
termios 结 构 保 存 起 来 。 在 以 后 再 转 回 规范 模式 时 恢复 它 。 
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表 18-7 非 规范 输入 的 四 种 情形 


MIN>0 MIN==0 
A: 在 计时 器 超时 前 ，read 返 回 C; 在 计时 器 超时 前 ，read 返 回 
[MIN, nbytes]; [1, nbytes], 
TIME > 0 若 计 时 器 超时 ，read 返 回 若 计 时 器 超时 ，read 返 回 0 


[1, MIN ) (TIME=read 计 时 器 ) 


(TIME= 字 节 间 计时 器 ， 调 用 者 可 能 无 限 阻塞 ) 


TIME ==0 | B. 可 用 时 ，read 返 回 [MIN, nbytes] D; read 立 即 返回 [0, nbytes] 
(调用 者 可 能 无 限 阻塞 ) 


程序 清单 18-10 定 义 了 函数 tty_cbreak 和 tty_raw， 它 们 将 终端 分 别 设置 为 cbreak 模 式 和 
raw (原始 ) MA (术语 cbreak 和 raw 来 自 于 V7 的 终端 驱动 程序 )。tty_reset 函 数 的 功能 是 将 
终端 恢复 为 以 前 的 工作 模式 (也 就 是 调用 tty_cbreak 和 tty_raw 之 前 的 工作 模式 )。 
如 果 已 调用 tty_cbreak， 那 么 在 调用 tty_raw 之 前 需要 调用 tty_reset。 如 果 已 调用 
tty_raw， 然 后 又 要 调用 tty_cbreak， 那 么 在 此 之 前 同样 也 要 调用 tty_reset。 这 减少 了 
出 错时 终端 处 于 不 可 用 状态 的 机 会 。 
该 程序 还 提供 了 tty_atexit 和 tty_termios 两 个 函数 。tty_atexit 可 被 登记 为 终止 
处 理 程序 ， 以 保证 exit 恢 复 终端 工作 模式 ，t ty_termios 则 返回 一 个 指向 原先 的 规范 模式 
termios 结 构 的 指针 。 











程序 清单 18-10 将 终端 模式 设置 为 原始 或 cbreak 模 式 


#include "apue .hn 
#include «termios.h» 
#include <errno.h> 


static struct termios save_termios; 

static int ttysavefd = -1; 

static enum { RESET, RAW, CBREAK ] ttystate = RESET; 

int 

tty_cbreak(int fd) /* put terminal into a cbreak mode */ 


int err; 
struct termios buf; 


if (ttystate != RESET) { 


errno = EINVAL; 
return(-1); 


if (tegetattr(fd, &buf) « 0) 


return(-1); 
Save termios - buf; /* structure copy */ 
/* 
* Echo off, canonical mode off. 
*/ 
buf.c lflag &- ^(ECHO | ICANON); 
/* 


* Case B: 1 byte at a time, no timer. 
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*/ 
buf.c cc[VMIN] = 1; 
buf.c_cc[VTIME] = 0; 
if (tcsetattr(fd, TCSAFLUSH, &buf) < 0) 
return(-1); 
/* 
* Verify that the changes stuck. tcsetattr can return 0 on 
* partial success. 
*/ 
if (tcgetattr(fd, &buf) < 0) { 
err = errno; 
tcsetattr (fd, TCSAFLUSH, &save termios); 
errno - err; 
return(-1); 
if ((buf.c lflag & (ECHO | ICANON)) || buf.c_cc[VMIN] !- 1 || 
buf.c cc[VTIME] != 0) { 
/* 
* Only some of the changes were made. Restore the 
* original settings. 
*/ 
tcsetattr (fd, TCSAFLUSH, &save_termios) ; 
errno = EINVAL; 
return (-1); 
} 
ttystate = CBREAK; 
ttysavefd = fd; 
return (0); 
} 
int 
tty_raw(int fd) /* put terminal into a raw mode */ 
int err; 


struct termios buf; 


if (ttystate != RESET) { 
errno = EINVAL; 
return(-1); 
) 
if (tcegetattr(fd, &buf) < 0) 
return(-1); 
Save termios - buf; /* structure copy */ 


/* 
* Echo off, canonical mode off, extended input 
* processing off, signal chars off. 
*/ 

buf.c lflag &= "(ECHO | ICANON | IEXTEN | ISIG); 


/* 

* No SIGINT on BREAK, CR-to-NL off, input parity 
* check off, don't strip 8th bit on input, output 
* flow control off. 


*/ 
buf.c iflag &= ~(BRKINT | ICRNL | INPCK | ISTRIP | IXON); 
/* 

* Clear size bits, parity checking off. 

*/ 
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buf.c cflag &- ~(CSIZE | PARENB); 


/* 
* Set 8 bits/char. 
*/ 
buf.c cflag |- CS8; 
/* 
* Output processing off. 
*/ 
buf.c oflag &= ^(OPOST); 
/* 
* Case B: 1 byte at a time, no timer. 
*/ 


buf.c cc[VMIN] = 1; 

buf.c cc[VTIME] = 0; 

if (tcsetattr(fd, TCSAFLUSH, &buf) < 0) 
return(-1); 


/* 
* Verify that the changes stuck. tcsetattr can return 0 on 
* partial success. 
*/ 
if (tegetattr(fd, &buf) < 0) { 
err - errno; 
tcsetattr(fd, TCSAFLUSH, &save termios); 
errno = err; 
return(-1); 
} 
if ((buf.c lflag & (ECHO | ICANON | IEXTEN | ISIG)) || 
(buf.c iflag & (BRKINT | ICRNL | INPCK | ISTRIP | IXON)) || 
(buf.c cflag & (CSIZE | PARENB | CS8)) != CS8 || 
(buf.c oflag & OPOST) || buf.c ccIVMIN] != 1 || 
buf.c_cc[VTIME] != 0) { 
/* 
* Only some of the changes were made. Restore the 
* original settings. 
*/ 
tcsetattr(fd, TCSAFLUSH, &save termios); 
errno = EINVAL; 
return(-1); 


} 


ttystate = RAW; 
ttysavefd = fd; 
return (0); 


} 
int 
tty_reset (int fd) /* restore terminal's mode */ 
{ 
if (ttystate == RESET) 
return (0); 
if (tcsetattr(fd, TCSAFLUSH, &save termios) < 0) 
return(-1); 
ttystate - RESET; 
return(0); 
) 
void 
tty atexit (void) /* can be set up by atexit(tty atexit) */ 
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{ 
if (ttysavefd >= 0) 
tty_reset (ttysavefd) ; 


} 


struct termios * 
tty_termios (void) /* let caller see original tty state */ 


return (&save_termios) ; 





我 们 对 cbreak 模 式 的 定义 如 下 : 

* 非 规范 模式 。 如 本 节 开 始 处 所 述 ， 这 种 模式 不 对 某 些 输入 特殊 字符 进行 处 理 。 这 种 模式 
没有 关闭 对 信号 的 处 理 ， 所 以 用 户 可 以 键入 任 一 终端 产生 的 信号。 调用 程序 应 当 捕 提 这 
些 信 和 号， 否则 这 种 信和 号 就 可 能 终止 程序 ， 并 且 终 端 仍 将 处 于 cbreak 模 式 。 

作为 一 般 规则 ， 在 编写 更 改 终端 模式 的 程序 时 ， 应 当 捕 捉 大 多 数 信号， 以 便 在 程序 
终止 前 恢复 终端 模式 。 

“关闭 回 显 (ECHO) 标志 。 

"每 次 输入 一 个 字 节 。 为 此 将 MIN 设 置 为 1， 将 TIME 设 置 为 0。 这 是 表 18-7 中 的 情形 B。 至 
少 有 一 个 字 节 可 用 时 ，read 再 返回 。 

对 原始 模式 的 定义 如 下 : 

“ 非 规范 模式 。 也 关闭 了 对 产生 信和 号 字符 (ISTG) 和 扩充 输入 字符 (IEXTEN) 的 处 理 。 
另外 ， 禁 用 BRKINT， 这 样 就 使 BREAK 字 符 不 再 产生 信号 。 

， 关 闭 回 显 (ECHO) 标志 。 

。 禁 用 ICRNL、INPCK、ISTRIP 和 IXON 标 志 。 从 而 不 再 将 输入 的 CR 字符 变换 为 NL 
(ICRNL)， 使 输入 奇偶 校 验 不 起 作用 (INPCK) ， 不 再 剥离 输入 字 节 的 第 8 位 (ISTRIP)， 
不 进行 输出 流 控 制 (IKON). 

。8 位 字符 (CS8)， 且 禁用 奇偶 性 检测 (PARENB), 

。 禁 用 所 有 输出 处 理 (OPOST), 

"每 次 输入 一 个 字 节 (MIN =1，TIME = 0)。 
程序 清单 18-11 测 试 原始 模式 和 cbreak 模 式 。 


程序 清单 18-11 测试 原始 终端 模式 和 cbreak 终 端 模式 


#include "apue.h" 


Static void 
Sig catch(int signo) 


printf ("signal caught in"); 
tty reset(STDIN FILENO); 
exit (0); 


int 
main (void) 


int i; 
char c; 
if (signal(SIGINT, sig catch) == SIG_ERR) /* catch signals */ 


err Sys("signal(SIGINT) error"); 
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if (signal (SIGQUIT, sig catch) == SIG ERR) 
err_sys ("signal (SIGQUIT) error"); 
if (signal (SIGTERM, sig catch) == SIG ERR) 


err sys("signal(SIGTERM) error"); 


if (tty raw(STDIN FILENO) « 0) 
err sysS("tty raw error"); 
printf("Enter raw mode characters, terminate with DELETE\n") ; 


while ((i = read(STDIN FILENO, &c, 1)) == 1) { 
if ((c & 255) == 0177) /* 0177 = ASCII DELETE */ 
break; 


printf ("%o\n", c); 


if (tty_reset (STDIN_FILENO) < 0) 
err_sys("tty_reset error"); 
if (i <= 0) 
err_sys ("read error"); 
if (tty cbreak(STDIN FILENO) « 0) 
err sys ("tty cbreak error"); 
printf ("\nEnter cbreak mode characters, terminate with SIGINT An"); 
while ((i = read(STDIN FILENO, &c, 1)) == 1) { 
c &= 255; 
printf ("%o\n", c); 


if (tty reset (STDIN FILENO) < 0) 
err_sys("tty_reset error"); 
if (i <= 0) 
err_sys("read error"); 
exit (0); 


} 
运行 该 程序 可 以 观察 这 两 种 终端 工作 模式 的 工作 情况 。 





$ ./a.out 
Enter raw mode characters, terminate with DELETE 

4 

33 

133 
61 
70 
176 
BEA DELETE 

Enter cbreak mode characters, terminate with SIGINT 
1 BEA Ctri-A 
10 键入 退 格 
signal caught 键 人 中 断 符 


在 原始 模式 中 ， 输 入 的 字符 是 Ctrlt+D(04) 和 特殊 功能 键 F7。 在 所 用 的 终端 上 ， 此 功能 键 产生 5 个 
字符 : ESC (033), [ (0133), 1 (061)，8 (070) 和 ~ (0176)。 注 意 ， 在 原始 模式 下 关闭 了 输出 处 理 
(~OPOST)， 所 以 在 每 个 字符 后 没有 得 到 回 车 符 。 另 外 也 要 注意 的 是 ， 在 cbreak 模 式 下 ， 不 对 输 
人 特殊 字符 进行 处 理 〈 所 以 对 Ctrl+D、 文 件 结束 符 和 退 格 等 不 进行 特殊 处 理 ) ， 但 是 对 终端 产 
生 的 信号 则 进行 处 理 。 口 


18.12 终端 的 窗口 大 小 


大 多 数 UNIX 系 统 都 提供 了 一 种 功能 ， 可 以 对 当前 终端 窗口 的 大 小 进行 跟踪 ， 在 窗口 大 小 
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发 生变 化 时 ， 使 内 核 通 知 前 台 进程 组 。 内 核 为 每 个 终端 和 伪 终 端 保存 一 个 winsize 结 构 : 


struct winsize { 
unsigned short ws_row; /* rows, in characters */ 
unsigned short ws col; /* columns, in characters */ 
unsigned short ws xpixel; /* horizontal size, pixels (unused) */ 
unsigned short ws ypixel; /* vertical size, pixels (unused) */ 
}; 
此 结构 的 作用 如 下 : 
。 用 ioctl ( 见 3.15 节 ) 的 TIOCGWINSZ 命 令 可 以 取 此 结构 的 当前 值 。 
“用 ioct1i 的 TTOCSWINSzZ 命 令 可 以 将 此 结构 的 新 值 存放 到 内 核 中 。 如 果 此 新 值 与 存放 在 
内 核 中 的 当前 值 不 同 ， 则 向 前 台 进 程 组 发 送 SIGWINCH 信 和 号。( 注 意 ， 从 表 10-1 中 可 以 看 
出 ， 此 信号 的 系统 默认 动作 是 忽略 。) 
“除了 存放 此 结构 的 当前 值 以 及 在 此 值 改 变 时 产生 一 个 信号 以 外 ， 内 核对 该 结构 不 进行 任 
何其 他 操作 。 对 结构 中 的 值 进行 解释 完全 是 应 用 程序 的 工作 。 
* 提供 这 种 功能 的 目的 是 ， 当 窗口 大 小 发 生变 化 时 通知 应 用 程序 (例如 vi 编辑 程序 ) 。 应 用 
程序 接 到 此 信号 后 ， 它 可 以 取 窗 口 大 小 的 新 值 ， 然 后 重 绘 屏幕 。 









程序 清单 18-12 打 印 当前 窗口 大 小 ， 然 后 休眠 。 每 次 窗口 大 小 改变 时 ， 就 捕捉 到 SIGWINCH 
信号 ， 然 后 打印 新 的 窗口 大 小 。 必 须 用 一 个 信号 终止 此 程序 。 


程序 清单 18-12 打印 窗口 大 小 





#include "apue .hn 
#include <termios.h> 
#ifndef TIOCGWINSZ 
#include <sys/ioctl.h> 
#tendif 


static void 
pr_winsize(int fd) 


struct winsize size; 


if (ioctl(fd, TIOCGWINSZ, (char *) &size) « 0) 
err sys ("TIOCGWINSZ error"); 
printf("$&d rows, $d columns\n", size.ws row, Size.ws col); 


Static void 
Sig winch(int signo) 


printf ("SIGWINCH received\n") ; 
pr_winsize (STDIN _FILENO) ; 


} 


int 
main (void) 


if (isatty (STDIN FILENO) == 0) 
exit (1); 
if (signal (SIGWINCH, sig winch) == SIG ERR) 


err sys("signal error"); 
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pr winsize(STDIN FILENO); /* print initial size */ 
for S572) /* and sleep forever */ 
pause () ; 


) 
在 一 个 带 窗口 终端 的 系统 上 运行 此 程序 得 到 : 


$ ./a.out 

35 rows, 80 columns 起 始 长 度 

SIGWINCH received 更 改 窗口 大 小 : 捕捉 到 信和 号 

40 rows, 123 columns 

SIGWINCH received 再 来 一 次 

42 rows, 33 columns 

^? $ 击 中 断 键 以 终止 D 


18.13 termcap, terminfodlcurses 


termcap 的 意思 是 终端 能 力 (terminal capability) ， 它 指 的 是 文本 文件 /etc/termcap 
和 一 套 读 此 文件 的 例 程 。termcap 这 种 技术 是 在 伯克利 发 展 起 来 的 ， 主 要 是 为 了 支持 vi 编辑 
器 。termcap 文 件 包 含 了 对 各 种 终端 的 说 明 : 终端 支持 哪些 功能 ( 行 数 、 列 数 、 是 否 支持 退 
格 等 )， 如 何 使 终端 执行 某 些 操作 ( 清 屏 、 将 光标 移动 到 指定 位 置 等 )。 把 这 些 信息 从 编译 过 
的 程序 中 取出 来 并 把 它们 放 在 易于 编辑 的 文本 文件 中 ， 这 样 就 使 得 vi 能 在 很 多 不 同 的 终端 上 
运行 。 

后 来 ， 支 持 termcap 文 件 的 一 套 例 程 从 vi 编辑 程序 中 抽取 出 来 ， 放 在 一 个 单独 的 curses 
库 中 。 为 使 这 套 库 被 要 进行 屏幕 处 理 的 任何 程序 使 用 ， 人 们 给 它 增 加 了 很 多 功能 。 

termcap 这 种 技术 不 是 很 完善 。 当 越 来 越 多 类 型 的 终端 被 加 到 该 数据 文件 中 时 ， 为 了 找到 
一 个 特定 的 终端 就 须 使 用 较 长 的 时 间 扫 找 此 文件 。 此 数据 文件 也 只 用 两 个 字符 的 名 字 来 标识 不 
同 的 终端 属性 。 这 些 缺 陷 导 致 开发 另 一 种 新 技术 一 terminfo 及 与 其 相关 的 curses 库 。 在 
terminfo 中 的 终端 说 明基 本 上 是 文本 说 明 的 编译 版 本 ， 在 运行 时 易于 快速 定位 。terminfo 
从 SVR2 就 开始 使 用 ， 此 后 所 有 的 系统 V 版 本 都 使 用 了 它 。 


以 往 ， 基 于 系统 V 的 系统 使 用 terminfo， 而 BSD 派 生 的 系统 则 使 用 termcap， 但 是 现在 ， 系 统 常 
常 提 供 这 两 者 。 MacOS X 仅 支持 terminfo。 





Goodheart[1991] 对 terminfo 和 curses 库 进行 了 详细 说 明 ， 但 此 书 已 绝版 。Strang[1986] 
说 明了 curses 限 数 库 的 伯克利 版 本 。Strang、Mui 和 O'Reilly[1988] 则 对 termcap 和 terminfo 
进行 了 说 明 。 
可 在 http://invisible-island.net/ncurses/ncurses .html 上 找到 与 SVR4 curses4d£u # 
容 的 自由 版 本 的 ncurses 函 数 库 。 


不 论 是 termcap 还 是 ezminfo， 它 们 本 身 都 不 处 理 本 章 所 述 及 的 问题 ， 如 更 改 终端 的 模 
式 、 更 改 终 端 特殊 字符 以 及 处 理 窗口 大 小 等 等 。 它 们 所 提供 的 是 在 各 种 终端 上 执行 一 般 性 操作 
( 清 屏 、 移 动 光标 ) 的 方法 。 另 一 方面 ， 在 本 章 所 述 问 题 方面 ，curses 能 提供 某 种 具体 细节 方 
面 的 帮助 。curses 提 供 了 很 多 函数 ， 包 括 设置 原始 模式 、 设 置 cbreak 模 式 、 打 开 和 关闭 回 显 等 
等 。 但 是 curses 是 为 字符 型 终端 设计 的 ， 而 现在 字符 型 终端 大 部 分 已 被 以 像素 为 基础 的 图 形 
终端 所 代替 。 


bbs.theithome.com 








540 第 18 章 终端 IO 


18.14 小 结 


终端 有 很 多 特征 和 选项 ， 其 中 大 多 数 都 可 按 需 进行 改变 。 本 章 说 明了 很 多 更 改 终端 操作 的 
函数 ， 比 如 更 改 特殊 输入 字符 和 可 选择 标志 的 函数 ， 还 介绍 了 可 对 终端 设备 设置 的 各 个 终端 特 
殊 字符 以 及 很 多 选项 。 . 

终端 的 输入 模式 有 规范 的 (每 次 一 行 ) 和 非 规 范 的 两 种 。 本 章 中 包含 了 若干 这 两 种 工作 模 
式 的 实例 ， 也 提供 了 一 些 函 数 ， 它 们 在 POSIX.1 终 端 选 项 和 较 早 的 BSD cbreak 及 原始 模式 之 间 
进行 变换 。 本 章 还 说 明了 如 何 取得 和 改变 终端 的 窗口 大 小 。 
习题 
18.1 编写 一 个 调用 tty_raw 并 且 不 恢复 终端 模式 就 终止 的 程序 。 如 果 你 的 系统 提供 reset(1) 

命令 〈 本 书 说 明 的 所 有 四 种 平台 都 提供 ) ， 使 用 该 命令 恢复 终端 模式 。 

182 c_cflag 字 段 的 PARODD 标 志 人 允许 我 们 设置 奇偶 校 验 ， 而 BSD 中 的 tip 程 序 也 允许 奇偶 校 

验 位 是 0 或 1， 它 是 如 何 实现 的 ? 

18.3 如 果 你 的 系统 中 stty(1) 命 令 输 出 MIN 和 TIME 值 ， 做 下 面 的 练习 。 两 次 登录 系统 ， 其 中 

一 次 登录 时 打开 vi 编辑 器 ， 在 另外 一 次 登录 中 用 stty 命 令 确定 vi 设置 的 MIN 和 TIME 值 

(vi 将 终端 设置 为 非 规范 模式 ) 。( 如 果 在 你 的 终端 上 运行 窗口 系统 ， 那 么 你 也 可 以 进行 同 

样 的 测试 ， 方 法 是 ;登录 一 次 ， 然 后 用 两 个 分 开 的 窗口 。) 
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在 第 9 章 ， 我 们 了 解 到 终端 登录 是 经 由 自动 提供 终端 语义 的 终端 设备 进行 的 。 在 终端 和 运 
行 的 程序 之 间 有 一 个 终端 行规 程 〈 见 图 18-2) ， 通 过 它 我 们 能 够 在 终端 上 设置 特殊 字符 ( 退 格 、 
行 删除 、 中 断 等 ) 。 但 是 ， 当 一 个 登录 请 求 到 达 网 络 连 接 时 ， 终 端 行规 程 并 不 是 自动 被 加 载 到 
网 络 连 接 和 登录 程序 shell 之 间 的 。 图 9-5 显 示 了 一 个 用 来 提供 终端 语义 的 伪 终 端 (pseudo- 
terminal) 设备 驱动 程序 。 

除了 用 于 网 络 登 录 ， 伪 终端 还 被 用 在 其 他 方面 ， 本 章 将 对 此 进行 介绍 。 我 们 首先 概要 叙述 
如 何 使 用 伪 终 端 ， 接 着 讨论 某 些 具体 的 使 用 例子 。 然 后 ， 我 们 提供 在 不 同 平台 上 用 于 创建 伪 终 
端的 函数 ， 并 使 用 这 些 函 数 编 写 一 个 程序 ， 我 们 将 该 程序 称 为 pty。 我 们 将 看 到 pty 程 序 的 一 
些 不 同 用 途 : 抄录 在 终端 上 输入 和 输出 的 所 有 字符 (script(1) 程 序 ) ， 运 行 协同 进程 来 避免 
程序 清单 15-10 中 遇 到 的 缓冲 问题 。 


19.2 概述 


擅 终 端 这 个 术语 暗示 对 于 一 个 应 用 程序 而 言 ， 它 看 上 去 像 一 个 终端 ， 但 事实 上 伪 终 端 并 不 
是 一 个 真正 的 终端 。 图 19-1 显 示 了 使 用 伪 终 端 时 相关 进程 的 典型 结构 。 其 中 关键 点 如 下 : 

* 通常 一 个 进程 打开 伪 终 端 主 设备 ， 然 后 调用 fork。 子 进程 建立 了 一 个 新 的 会 话 ， 打 开 一 

个 相应 的 伪 终 端 从 设备 ， 将 其 文件 描述 符 复制 到 标准 输入 、 标 准 输 出 和 标准 出 错 ， 然 后 

调用 exec。 伪 终端 从 设备 成 为 子 进程 的 控制 终端 。 

。 对 于 伪 终 端 从 设备 之 上 的 用 户 进程 来 说 ， 其 标准 输入 、 标 准 输出 和 标准 出 错 都 是 终端 设 

备 。 对 于 这 些 文件 描述 符 ， 用 户 进 程 能 够 调用 第 18 章 中 说 明 的 所 有 输入 /输出 函数 。 但 是 

因为 在 伪 终 端 从 设备 之 下 并 没有 真正 的 终端 设备 ， 无 意义 的 函数 调用 (改变 波 特 率 、 发 

送 中 断 符 、 设 置 奇偶 校 验 等 ) 将 被 忽略 。 

* 任何 写 到 伪 终 端 主 设备 的 东西 都 会 作为 从 设备 的 输入 ， 反 之 亦 然 。 事 实 上 所 有 从 设备 端 

的 输入 都 来 自 于 伪 终 端 主 设备 上 的 用 户 进程 。 这 看 起 来 就 像 一 个 双向 管道 ， 但 从 设备 上 

的 终端 行规 程 使 我 们 拥有 普通 管道 没有 的 其 他 处 理 能 力 。 

图 19-1 显 示 了 FreeBSD、Mac OSX 或 Linux 系 统 中 伪 终 端的 结构 。19.3.2 节 和 19.3.3 节 将 介绍 如 何 打 
开 这 些 设备 。 

在 Solaris 中 ， 伪 终端 是 使 用 STREAMS 子 系统 构建 的 ( 见 14.4 节 )。 图 19-2 详 细 描 述 了 
Solaris 中 各 个 伪 终 端 STREAMS 模 块 之 间 的 关系 。 虚 线 框 中 的 两 个 STREAMS 模 块 是 可 选 的 。 
pckt 和 ptem 模 块 帮助 提供 伪 终 端 特有 的 语义 。 另 外 两 个 模块 (ldtermfüttcompat) 提供 了 
行规 程 处 理 。 
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内 核 






伪 终 端 主 设备 伪 终 端 从 设备 


图 19-1 使 用 伪 终 端的 相关 进程 的 典型 结构 图 19-2 Solaris 中 的 伪 终 端 结构 


请 注意 从 设备 上 的 三 个 STREAMS 模 块 与 程序 清单 14-9 (网 络 登 录 ) 的 输出 是 一 样 的 。 
19.3.1 节 将 介绍 如 何 组 织 这 些 STREAMS 模 块 。 

从 现在 开始 将 简化 以 上 图 示 ， 不 再 画 出 图 19-1 中 的 “ 读 、 写 函数 ”或 图 19-2 中 的 “ 流 首 ”。 
使 用 缩写 “PTY” 表 示 伪 终端 ， 并 将 图 19-2 中 所 有 伪 终 端 从 设备 之 上 的 STREAMS 模 块 合并 在 
一 起 表示 为 “终端 行规 程 ” 模 块 ， 这 与 图 19-1 类 似 。 

现在 ， 我 们 来 观察 伪 终 端的 某 些 典型 用 途 。 

1. 网 络 登录 服务 器 

伪 终 端 可 用 于 构造 网 络 登 录 服 务 器 。 典 型 的 例子 是 telneta 和 rlogind 服 务 器 。 
Stevens[1990] 第 15 章 详细 讨论 了 提供 rlogin 服 务 的 步骤 。 一 旦 登录 shell 运 行 在 远 端 主机 上 ， 
即 可 得 到 如 图 19-3 的 结构 。telnetad 服 务 器 使 用 类 似 的 结构 。 

在 rlogina 服 务 器 和 登录 shell 之 间 有 两 个 exec 调 用 ， 这 是 因为 1ogin 程 序 通常 是 在 两 个 
exec 之 间 检 验 用 户 是 否 合法 。 

本 图 的 一 个 关键 点 是 驱动 PTY 主 设备 的 进程 通常 同时 在 读 写 另 一 个 IO 流 。 图 中 另 一 个 IO 
流 是 TCP/PP 框 。 这 表示 该 进程 必然 使 用 了 如 select 或 bol11 那 样 的 UO 多 路 转 接 ( 见 14.5 节 )， 
或 被 分 成 两 个 进程 或 线程 。 

2. script 程 序 

script(1) 程 序 是 随 大 多 数 UNIX 系 统 提供 的 ， 它 将 终端 会 话 的 所 有 输入 和 输出 信息 复制 到 
一 个 文件 中 。 它 将 自己 置 于 终端 和 登录 shell 的 一 个 新 调用 之 间 ， 从 而 完成 此 工作 。 图 19-4 详 细 
描述 了 script 程 序 中 有 关 的 交互 。 这 里 要 特别 指出 ，script 程 序 通常 是 从 登录 shell 启 动 的 ， 
该 shell 然 后 等 待 script 程 序 的 结束 。 
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图 19-4_ script 程序 


script 程 序 运行 时 ， 位 于 PTY 从 设备 之 上 的 终端 行规 程 的 所 有 输出 都 被 复制 到 script 文 件 
中 (通常 叫做 Eypescript)。 因 为 击 键 通 常 由 该 行规 程 模块 回 显 ， 所 以 该 script 文 件 也 包括 了 
输入 的 内 容 。 但 是 ， 因 为 键入 的 口令 不 被 回 显 ， 所 以 该 文件 不 会 包含 口令 。 

在 编写 本 书 第 1 版 时 ，Rich Stevens 用 script 程 序 获 取 实 例 程 序 的 输出 。 这 样 避免 了 手工 复制 程序 
输出 可 能 带 来 的 错误 。 但 是 ， 使 用 script 的 不 足 之 处 是 必须 处 理 script 文 件 中 的 控制 字符 。 

在 19.5 节 开发 了 通用 的 pty 程 序 后 ， 我 们 将 看 到 使 用 pty 程 序 和 一 个 简单 的 shell 脚 本 就 能 够 
实现 一 种 script 程 序 版 本 。 

3. expect 程 序 

伪 终 端 可 以 用 来 在 非 交 互 模式 中 驱动 交互 式 程序 的 运行 。 许 多 程序 需要 一 个 终端 才能 运行 ， 
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passwa(1) 命 令 就 是 一 个 例子 ， 它 要 求 用 户 在 系统 提示 后 输入 口令 。 

为 了 支持 批 处 理 操 作 模 式 而 修改 所 有 交互 式 程序 ， 是 非常 麻烦 的 。 相 比 之 下 ， 一 个 更 好 的 
解决 方法 是 通过 一 个 脚本 来 驱动 交互 式 程序 。expect 程 序 [Libes 1990，1991，1994] 提 供 了 这 
样 的 方法 。 类 似 于 19.5 节 的 pty 程 序 ， 它 使 用 伪 终 端 来 运行 其 他 程序 。 并 且 ，expect 还 提供 了 
一 种 编程 语言 用 于 检查 运行 程序 的 输出 ， 以 确定 用 什么 作为 输入 发 送 给 该 程序 。 当 一 个 源 自 脚 
本 的 交互 式 的 程序 正在 运行 时 ， 不 能 仅仅 是 将 脚本 中 的 所 有 内 容 输入 到 程序 中 去 ， 或 将 程序 的 
输出 送 至 脚本 ， 而 是 要 检查 程序 的 输出 ， 从 而 决定 下 一 步 输入 的 内 容 。 

4. 运行 协同 进程 

在 程序 清单 15-10 所 示 的 协同 进程 例子 中 ， 我 们 不 能 调用 使 用 标准 1O 库 进行 输入 、 输 出 的 
协同 进程 ， 这 是 因为 当 通过 管道 与 协同 进程 进行 通信 时 ， 标 准 VO 库 会 将 标准 输入 和 输出 的 内 容 
放 到 缓冲 区 中 ， 从 而 引起 死 锁 。 如 果 协 同 进程 是 一 个 已 经 编译 的 程序 而 我 们 又 没有 源 程序 ， 则 
无 法 在 源 程序 中 加 入 fflush 语 句 来 解决 这 个 问题 。 图 15-8 显 示 了 一 个 进程 驱动 协同 进程 的 情 
况 。 我 们 须要 做 的 是 将 一 个 人 擅 终 端 放 到 两 个 进程 之 间 ( 见 图 19-5)， 这 诱 使 协同 进程 认为 它 是 由 
终端 而 非 另 一 个 进程 驱动 的 。 

协同 进程 


管道 1 
实施 驱动 
A £5.) 
E. 2 uw - : a 
管道 2 


图 19-5 用 伪 终 端 驱 动 一 个 协同 进程 

现在 协同 进程 的 标准 输入 和 标准 输出 就 像 终端 设备 一 样 ， 所 以 标准 1O 库 会 将 这 两 个 流 设置 为 行 
缓冲 。 

父 进程 有 两 种 方法 在 自身 和 协同 进程 之 间 获 得 伪 终 端 (这 种 情况 下 的 父 进程 可 以 类 似 程序 清 
单 15-9, 使 用 两 个 管道 和 协同 进程 进行 通信 ， 或 者 像 程序 清单 17-1 那 样 ,使 用 一 个 STREAMS 管 道 )。 
一 种 方法 是 父 进 程 直接 调用 pty_fork 函 数 ( 见 19.4 节 ) 而 不 是 fork。 另 一 种 方法 是 将 协同 进程 
作为 参数 来 调用 exec 执 行 该 pty 程 序 ( 见 19.5 节 ) 。 我 们 将 在 说 明 pty 程 序 后 介绍 这 两 种 方法 。 

5. 观看 长 时 间 运 行程 序 的 输出 

使 用 任何 一 个 标准 shell， 可 以 将 一 个 需要 长 时 间 运 行 的 程序 放 到 后 台 运 行 。 但 是 如 果 将 该 
程序 的 标准 输出 重 定向 到 一 个 文件 ， 并 且 它 产生 的 输出 又 不 多 ， 那 么 我 们 就 不 能 方便 地 监控 程 
序 的 进展 ， 这 是 因为 标准 VO 库 会 将 标准 输出 全 部 放 在 缓冲 区 中 。 我 们 看 到 的 将 只 是 标准 1/O 库 
函数 写 到 输出 文件 中 的 成 块 输出 ， 有 时 甚至 可 能 是 大 到 8192 字 节 的 一 块 。 

如 果 有 源 程序 ， 则 可 以 加 入 fflush 调 用 。 另 一 种 方法 是 ， 可 以 在 pty 程 序 下 运行 该 程序 ， 
让 标准 MO 库 认 为 标准 输出 是 终端 。 图 19-6 说 明了 这 个 结构 ， 我 们 将 这 个 缓慢 输出 的 程序 称 为 
sl1owout。 从 登录 shell 到 pty 进 程 的 fort/exec 箭 头 用 虚线 表示 ， 以 强调 pty 进 程 是 作为 后 台 
任务 运行 的 。 


19.3 打开 伪 终 端 设备 


各 种 平台 打开 伪 终 端 设备 的 方法 有 所 不 同 。 在 Single UNIX Specification 的 XSI 扩 展 中 包含 
了 很 多 函数 ， 试 图 统一 这 些 方法 。 这 些 函 数 的 基础 是 SVR4 用 于 管理 基于 STREAMS 的 伪 终 端的 
一 组 函数 。 

posix_openpt 用 来 打开 下 一 个 可 用 的 伪 终 端 主 设备 ， 该 函数 是 可 移植 的 。 
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图 19-6 使 用 伪 终 端 运行 一 个 缓慢 输出 的 程序 


#include <stdlib.h> 
#include «fcntl.h» 


int posix_openpt (int oflag); 


返回 值 : 车 成 功 则 返回 下 一 个 可 用 的 PTY 主 设备 的 文件 描述 符 ， 若 出 错 则 返回 ~1 





参数 oflag 是 一 个 位 屏 项 字 ， 指 定 如 何 打 开 主 设备 ， 它 类 似 于 open(2) 的 oflag 参 数 ， 但 是 并 不 支 
持 所 有 打开 标志 。 对 于 posix_openpt， 我 们 可 以 指定 0_RDWR， 要 求 打开 主 设备 进行 读 、 
By, 可 以 指定 0_NOCTTY 以 防止 主 设备 成 为 调用 者 的 控制 终端 。 其 他 打开 标志 都 会 导致 未 定义 

在 擅 终 端 从 设备 可 被 使 用 之 前 ， 必 须 设置 它 的 权限 ， 使 得 应 用 程序 可 以 访问 它 。grantpt 
函数 提供 这 样 的 功能 。 它 把 从 设备 节点 的 用 户 ID 设置 为 调用 者 的 实际 用 户 ID ， 设 置 其 组 ID 为 一 
非 指定 值 ， 通 常 是 可 以 访问 该 终端 设备 的 组 。 将 权限 设置 为 对 单个 所 有 者 是 读 / 写 ， 对 组 所 有 
者 是 写 (0620) 。 

#include <stdlib.h> 

int grantpt (int filedes) ; 


int unlockpt (int filedes) ; 


两 个 函数 的 返回 值 ， 若 成 功 则 返回 9，， 若 出 错 则 返回 -1 





为 了 更 改 从 设备 节点 的 权限 ，grantpt 可 能 需要 fork 以 及 exec 一 个 设置 用 户 ID 程序 (B 
如 在 Solaris 中 是 /usr/1Lip/pt_chmod)。 于 是 ， 如 果 调 用 者 正在 捕捉 SIGCHLD 信 号 ， 那 么 其 
运行 行为 是 没有 说 明 的 。 

unlockpt 国 数 用 于 准予 对 擅 终 端 从 设备 的 访问 ， 从 而 允许 应 用 程序 打开 该 设备 。 阻 止 其 他 
进程 打开 从 设备 后 ， 建 立 该 设备 的 应 用 程序 有 机 会 在 使 用 主 、 从 设备 之 前 正确 地 初始 化 这 些 设备 。 
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注意 ， 在 grantpt 和 unlockpt 这 两 个 函数 中 ， 文件 描述 符 参数 是 与 主 伪 终 端 设备 关联 的 
文件 描述 符 。 

ptsname 函 数 用 于 在 给 定 主 伪 终 端 设 备 的 文件 描述 符 时 ， 找到 从 伪 终 端 设 备 的 路 径 名 。 这 
使 应 用 程序 可 以 独立 于 给 定 平台 的 某 种 惯例 而 标识 从 设备 。 注意 ， 该 函数 返回 的 名 字 可 能 存放 
在 静态 存储 区 中 ， 所 以 以 后 的 调用 可 能 会 蔬 盖 它 。 


#include <stdlib.h> 


char *ptsname(int filedes) ; 


返回 值 ， 若 成 功 则 返回 指向 PTY 从 设备 名 的 指针 ， 若 出 错 则 返回 NULL 





表 19-1 摘 要 列 出 T Single UNIX Specification 中 的 伪 终 端 函 数 ， 指 出 了 本 书 讨论 的 四 种 UNIX 
系统 支持 哪些 函数 。 


表 19-1 XSI 伪 终端 函数 


FreeBSD Linux Mac OS X Solaris 


grantpt 更 改 从 PTY 设 备 的 权限 


posix openpt | 打开 一 主 PTY 设 各 
ptsname 返回 从 PTY 设 备 的 名 字 
unlockpt 允许 从 PTY 设 备 被 打开 





在 FreeBSD 中 ，unlockpt 不 执行 任何 操作 ; 只 是 为 了 调 用 posix_openpt 的 应 用 程序 的 兼容 性 而 
定义 了 0_NOCTTY 标 志 。 在 FreeBSD 中 打开 终端 设备 并 不 会 导致 分 配 控制 终端 的 副作用 ， 所 以 
0_NOCTTY 标 志 并 无 作用 。 


尽管 Single UNIX Specification 已 试图 改善 在 此 方面 的 可 移植 性 ， 但 如 表 19-1 所 示 ， 实 现 还 
是 落后 于 标准 ， 正 在 逐步 赶 上 。 于 是 ， 我 们 提供 了 ptym_open 和 ptys_open 这 两 个 函数 处 理 
所 有 的 细节 ， 前 者 打开 下 一 个 可 用 的 PTY 主 设备 ， 后 者 打开 相应 的 从 设备 。 


#include "apue.h" 









int ptym open (char *pts name, int pts_namesz) ; 
BEE: 若 成 功 则 返回 PTY 主 设备 的 文件 描述 符 ， 若 出 错 则 返回 -1 
int ptys_open(char *pts_name) ; 


返回 值 : 若 成 功 则 返回 PTY 从 设备 的 文件 描述 符 ， 若 出 错 则 返回 _1 






通常 我 们 不 直接 调用 这 两 个 函数 ， 函 数 pty_fork ( 见 19.4 节 ) 调用 它们 ,并 且 也 用 fork 产 生 
出 一 个 子 进程 。 

Ptym_open 确 定 下 一 个 可 用 的 PTY 主 设备 并 打开 该 设备 。 调用 者 必须 分 配 一 个 数组 来 存放 
主 设备 或 从 设备 的 名 字 ， 并 且 如 果 调 用 成 功 ， 相应 的 从 设备 名 字 会 通过 pts_name 返 回 。 然 后 ， 
把 这 个 名 字 传 给 ptys_open, ptys op en MARTHQMARS, SKK h 
pts nameszf&3&, BiAptym open ARE ALIAS aR KER 

在 说 明了 pty_fork 函 数 之 后 ， 就 容易 明白 为 何 要 提供 两 个 函数 来 打开 这 两 个 设备 。 通 常 ， 
一 个 进程 调用 ptym_open 来 打开 一 个 主 设备 并 且 得 到 从 设备 的 名 称 。 该 进程 然后 以 fork 分 出 
子 进 程 ， 子 进程 在 调用 setsiq 建 立新 的 会 话 后 调用 ptys_open 打 开 从 设备 。 这 就 是 从 设备 如 
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何 成 为 子 进程 的 控制 终端 的 过 程 。 
19.3.1 基于 STREAMS 的 伪 终 端 


Solaris 下 所 有 伪 终 端的 STREAMS 实 现 细节 在 Sun Microsystems[2002] 的 Appendix C 中 有 所 
说 明 。 我 们 通过 一 个 STREAMS 克 隆 设备 (clone device) 对 下 一 个 可 用 的 PTY 主 设备 进行 访问 。 
克隆 设备 是 一 个 特殊 设备 ， 打 开 它 时 返回 一 个 未 用 设备 。( 在 Rago[1993] 中 ， 详 细 讨 论 了 
STREAMS 克 隆 设备 的 打开 。) 

基于 STREAMS 的 PTY 主 克隆 设备 是 /dev /ptmx。 当 我 们 打开 该 设备 ， 其 克隆 open 例 程 自 
动 决定 第 一 个 未 被 使 用 的 PTY 主 设备 ， 并 打开 这 个 设备 ( 见 程序 清单 19-1)。( 下 一 节 将 看 到 在 
基于 BSD 的 系统 中 ， 我 们 必须 自己 找到 第 一 个 未 被 使 用 的 PTY 主 设备 。) 


程序 清单 19-1 基于 STREAMS 的 伪 终 端 打开 函数 


#include "apue.h" 
#include <errno.h> 
#include <fcntl.h> 
#include <stropts.h> 





int 
ptym open(char *pts name, int pts namesz) 


char *ptr; 
int fdm; 
/* 


* Return the name of the master device so that on failure 
* the caller can print an error message. Null terminate 
* to handle case where strlen("/dev/ptmx") » pts namesz. 


*/ 
strncpy (pts name, "/dev/ptmx", pts namesz); 
pts name[pts namesz - 1] = 'X0'; 


if ((fdm = open(pts name, O RDWR)) « 0) 
return(-1); 

if (grantpt(fdm) < 0) { /* grant access to slave */ 
close (fdm); 
return(-2); 


if (unlockpt(fdm) « 0) { /* clear slave's lock flag */ 
close(fdm); 
return(-3); 


if ((ptr = ptsname(fdm)) == NULL) { /* get slave's name */ 
close(fdm); 
return (-4); 

} 

/* 


* Return name of slave. Null terminate to handle 
* case where strlen(ptr) > pts_namesz. 


xf 
strncpy(pts name, ptr, pts namesz); 
pts name[pts namesz - 1] = 'X0'; 
return(fdm); /* return fd of master */ 
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ptys open(char *pts name) 


int fds, setup; 

/* 

* The following open should allocate a controlling terminal. 
*/ 


if ((fds = open(pts name, O RDWR)) < 0) 
return(-5); 


/* 
* Check if stream is already set up by autopush facility. 
* 


if ((setup = ioctl(fds, I FIND, "ldterm")) « 0) ( 
close (fds) ; 
return (-6); 

if (setup == 0) { 


if (ioctl(fds, I PUSH, "ptem") < 0) { 
close (fds) ; 
return (-7); 


} 

if (ioctl (fds, I PUSH, "ldterm") < 0) { 
close (fds); 
return (-8); 


if (ioctl (fde, I PUSH, "ttcompat") < 0) ( 
close (fds) ; 
return (-9); 


return (fds) ; 


} 
i a HH€—Ó 


首先 用 open 打 开 克隆 设备 /aev/ptmx， 得 到 PTY 主 设备 的 文件 描述 符 。 打 开 这 个 主 设备 自动 
锁定 了 对 应 的 从 设备 。 

然后 调用 gzantpt 来 改变 从 设备 的 访问 权限 。 在 Solaris 中 ， 它 执行 如 下 操作 :将 从 设备 的 
所 有 权 改 为 实际 用 户 ID， 将 组 所 有 权 改 为 组 tty， 将 权限 改 为 只 允许 用 户 - 读 ， 用 户 一 写 和 组 一 
写 。 将 组 所 有 权 设 置 为 Lty 并 允许 组 一 写 权 限 是 因为 程序 wal1(1) 和 write(]) 是 设置 ~ 组 -ID 的 ， 
并 且 组 为 tty。 调 用 函数 grantpt 执 行程 序 /usr/1ib/pt_chmod。 访 程序 是 设置 -用 户 -ID 
的 ， 并 且 用 户 为 root， 因 此 它 能 够 修改 从 设备 的 所 有 者 和 权限 。 

函数 unlockpt 用 来 清除 从 设备 的 内 部 锁 。 在 打开 从 设备 前 必须 做 这 件 事情 。 另 外 ， 我 们 
必须 调用 ptsname 来 得 到 从 设备 的 名 字 。 这 个 名 字 的 格式 是 /dev/pts /NNN， 

接 下 来 的 函数 是 ptys_open， 该 函数 被 用 来 真正 打开 一 个 从 设备 。Solaris 沿 袭 了 系统 V 的 处 
理 模 式 ， 如 果 调 用 者 是 一 个 还 没有 控制 终端 的 会 话 首 进 程 ， 调 用 open 就 会 分 配 一 个 PTY 从 设备 
作为 它 的 控制 终端 。 如 果 不 希 望 该 函数 自动 做 这 件 事 ， 可 以 在 调用 open 时 指明 0_NOCTTY 标 志 。 

打开 从 设备 后 ， 将 三 个 STREAMS 模 块 压 和 人 从 设备 的 流 中 。ptem 是 伪 终 端 仿真 模块 ， 
19term 是 终端 行规 程 模块 ， 这 两 个 模块 合 在 一 起 像 一 个 真正 的 终端 一 样 工作 。ttcompat 提 
供 了 向 早期 系统 (如 V7、4BSD 和 Xenix) 的 ioct1 调 用 的 兼容 性 。 这 是 一 个 可 选 的 模块 ， 但 是 
因为 对 于 控制 台 登 录 和 网 络 登录 ， 它 是 自动 被 压 和 的 ( 见 程序 清单 14-9 程 序 的 输出 ) ， 所 以 我 
们 将 其 压 和 人 到 从 设备 的 流 中 。 

我 们 可 能 并 不 需要 压 人 这 三 个 模块 ， 其 原因 是 ， 它 们 可 能 已 经 位 于 流 中 。STREAMS 系 统 支 
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持 称 为 autopush (自动 压 人 ) 的 设施 ， 它 帮助 系统 管理 员 配 置 一 张 模块 列表 ， 只 要 打开 一 特定 设 
备 ， 就 将 这 些 模 块 压 入 流 中 ( 详 见 Rago[1993])。 我 们 使 用 I_FIND ioct1 命 令 观察 1aterm 是 否 
已 在 流 中 。 如 果 是 ， 则 认为 读 流 已 用 autopush 机 制 配 置 ， 这 样 就 无 需 再 重复 压 和 相应 模块 。 

调用 ptym_open 和 ptys_open 函 数 的 结果 是 在 调用 进程 中 打开 了 两 个 文件 描述 符 ， 一 个 
是 针对 主 设备 的 ， 另 一 个 是 针对 从 设备 的 。 


19.3.2 基于 BSD 的 伪 终 端 


在 基于 BSD 和 基于 Linux 的 系统 中 ， 我 们 提供 了 自己 的 XSI 函 数 版 本 ， 根 据 基础 平台 提供 了 
哪些 函数 ， 我 们 可 选 地 将 它们 包括 在 我 们 的 函数 库 中 。 

在 我 们 的 posix_openpt 版 本 ( 见 程序 清单 19-2) 中 ， 我 们 必须 自己 确定 第 一 个 可 用 的 PTY 
主 设备 。 为 达到 此 目的 ， 从 /dev/ptyp0 开 始 并 不 断 尝试 ， 直 到 成 功 打 开 一 个 可 用 的 PTY 主 设备 
或 试 完了 所 有 设备 。 在 打开 设备 时 ， 可 能 得 到 以 下 两 种 不 同 的 错误 EIO 指 示 设 备 已 经 被 使 用 ， 
ENOENT 表 示 设 备 不 存在 。 当 检测 到 后 一 种 情况 ， 这 表明 所 有 的 PTY 设 备 都 已 在 使 用 之 中 ， 于 是 
就 可 以 停止 搜索 。 一 旦 成 功 地 打开 一 个 例如 名 为 /dev/ptyMN 的 PTY 主 设备 ， 那 么 对 应 的 从 设备 
名 为 /dev/ttyMN。 在 Linux 中 ， 如 果 PTY 主 设备 名 是 /dev/pty/mXX， 那 么 对 应 的 PTY 从 设备 
名 是 /dev/pty/sXX。 


程序 清单 19-2 BSD 和 Linux 的 伪 终 端 打开 函数 


#include "apue .hn" 
#include <errno.h> 
#include <fcntl.h> 
#include «grp.h» 


#ifndef HAS OPENPT 
int 
posix openpt(int oflag) 


int fdm; 
char *ptrl, *ptr2; 
char ptm name[16]; 


strcpy(ptm name, "/dev/ptyXY"); 
/* array index: 0123456789 (for references in following code) */ 
for (ptrl = "pqrstuvwxyzPQRST"; *ptrl != 0; ptrl++) ( 
ptm name[8] = *ptrl; 
for (ptr2 = "0123456789abcdef"; *ptr2 !- 0; ptr2++) ( 
ptm name[9] = *ptr2; 
/* 
* Try to open the master. 
* 
/ 
if ((fdm = open(ptm name, oflag)) < 0) { 
if (errno == ENOENT) /* different from EIO */ 
return(-1); /* out of pty devices */ 
else 
continue; /* try next pty device */ 


return(fdm); /* got it, return fd of master */ 


) 
) 


errno - EAGAIN; 
return(-1); /* out of pty devices */ 


bbs.theithome.com 


Nn 








550 — RISE HH 9t H 





} 


#endif 


#ifndef HAS PTSNAME 

char * 

ptsname (int fdm) 

{ 
static char pts name[16]; 
char *ptm name; 


ptm name - ttyname(fdm); 
if (ptm name == NULL) 
return (NULL); 
strncpy(pts name, ptm name, sizeof(pts name)); 


pts name[sizeof(pts name) - 1] = 'VX0'; 
if (strncmp (pts name, "/dev/pty/", 9) == 0) 

pts name[9] = ‘a’; /* change /dev/pty/mXX to /dev/pty/sXX */ 
else 


pts name[5] = 't'; /* change "pty" to "tty" */ 
return(pts name); 


) 


#endif 


#ifndef _HAS_GRANTPT 

int 

grantpt (int fdm) 

{ 
struct group *grptr; 
int gid; 
char *pts_name; 
pts name = ptsname(fdm); 


if ((grptr = getgrnam("tty")) != NULL) 
gid = grptr-»gr gid; 


else 
gid = -1; /* group tty is not in the group file */ 
/* 
* The following two calls won't work unless we're the superuser. 
*/ 


if (chown(pts name, getuid(), gid) « 0) 
return(-1); 
return(chmod(pts name, S IRUSR | S IWUSR | S IWGRP)); 


) 


#endif 

#ifndef HAS UNLOCKPT 
int 

unlockpt (int fdm) 


{ 
} 


#endif 


return(0); /* nothing to do */ 


int 
ptym_open(char *pts_name, int pts_namesz) 


char *ptr; 
int fdm; 
/* 


* Return the name of the master device so that on failure 
* the caller can print an error message. Null terminate 
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* to handle case where string length > pts namesz. 


xf 
strncpy(pts name, "/dev/ptyXX", pts namesz); 
pts name[pts namesz - 1] = ’\0'; 


if ((fdm = posix openpt(O RDWR)) < 0) 
return(-1); 

if (grantpt(fdm) < 0) { /* grant access to slave */ 
close (fdm) ; 
return(-2); 


if (unlockpt(fdm) « 0) { /* clear slave's lock flag */ 
close(fdm); 
return(-3); 


if ((ptr = ptsname(fdm)) == NULL) { /* get slave's name */ 
close (fdm) ; 
return (-4) ; 

} 

/* 

* Return name of slave. Null terminate to handle 

* case where strlen(ptr) > pts_namesz. 


x 
strncpy(pts name, ptr, pts namesz); 
pts name[pts namesz - 1] = '\0’; 
return(fdm); /* return fd of master */ 
} 
int 


ptys_open(char *pts name) 


int fds; 


if ((fds = open(pts name, O RDWR)) « 0) 
return(í(-5); 
return(fds); 


) 


在 我 们 的 grantpt 函 数 版 本 中 ,调用 了 chown 和 chmod 函 数 ， 但 是 必须 意识 到 调用 这 两 个 


函数 的 进程 必须 有 超级 用 户 权 限 ， 否 则 这 两 个 函数 都 不 能 正常 工作 。 如 果 必 须 改 变 所 有 权 或 权 
限 保护 ， 那 么 这 两 个 函数 调用 必须 放 在 一 个 设置 用 户 ID 的 root 用 户 的 可 执行 程序 中 ， 这 类 似 于 
Solaris 实 现 grantpt 函 数 的 方法 。 

程序 清单 19-2 中 的 函数 ptys_open 简 单 地 打开 该 从 设备 ， 不 需要 其 他 初始 化 操作 。 在 基于 
BSD 的 系统 之 下 打开 PTY 从 设备 不 具有 分 配 该 设备 作为 控制 终端 的 副作用 。19.4 节 将 探讨 如 何 
在 基于 BSD 的 系统 下 分 配 控制 终端 。 


我 们 的 Posix_openpt 函 数 版 本 尝试 16 组 不 同 的 PTY 主 设备 : 从 /dev/ptyp0 到 /dev/ptyTf。 可 
用 的 实际 PTY 设 备 数 取 决 于 两 个 因素 : (a) 内 核 中 配置 的 数量 ; (b) 在 /dev 目 录 中 已 创建 的 特殊 设备 文 
件数 。 对 于 任何 程序 来 说 ， 可 用 数量 是 (a) 和 (b) 中 较 小 的 那 一 个 。 


19.3.3 基于 Linux 的 伪 终 端 


Linux 支 持 访问 伪 终 端的 BSD 方 法 ， 所 以 程序 清单 19-2 中 所 示 的 函数 对 于 Linux 同 样 适用 。 
然而 ，Linux 也 支持 使 用 /dev/ptmx (但 这 不 是 STREAMS 设 备 ) 的 克隆 风格 的 伪 终 端 接 口 。 
该 克隆 风格 接口 要 求 额外 步骤 去 标识 和 解锁 从 设备 。 在 Linux 里 ,我 们 可 以 使 用 程序 清单 19-3 中 
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的 函数 访问 从 设备 。 
程序 清单 19-3 Linux 的 伪 终 端 cpen 函 数 


#include "apue.h" 
#include <fentl.h> 


#ifndef HAS OPENPT 
int 

posix openpt(int oflag) 
{ 


int fdm; 


fdm = open("/dev/ptmx", oflag); 
return(fdm); 


) 


ftendif 


#ifndef HAS PTSNAME 
char * 
ptsname(int fdm) 


{ 
int sminor; 
static char pts name[16]; 


if (ioctl(fdm, TIOCGPTN, &sminor) < 0) 

return(NULL); 
snprintf(pts name, sizeof(pts name), "/dev/pts/%d", sminor); 
return(pts name); 


) 


#endif 


#ifndef HAS GRANTPT 
int 
grantpt (int fdm) 


char *pts name; 


pts name = ptsname(fdm); 
return(chmod(pts name, S IRUSR | S IWUSR | S IWGRP)); 


) 


#endif 

#ifndef HAS UNLOCKPT 
int 

unlockpt (int fdm) 


int lock = 0; 


return(ioctl(fdm, TIOCSPTLCK, &lock)); 


) 


#endif 


int 
ptym_open (char *pts_name, int pts_namesz) 


char *ptr; 
int fdm; 
/* 


* Return the name of the master device so that on failure 
* the caller can print an error message. Null terminate 
* to handle case where string length > pts_namesz. 
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*/ 
strncpy(pts name, "/dev/ptmx", pts namesz); 
pts name[pts namesz - 1] = '\0’; 


fdm = posix openpt(O RDWR); 


if (fdm < 0) 
return(-1); 

if (grantpt (fdm) < 0) ( /* grant access to slave */ 
close (fdm) ; 


return (-2); 

} 

if (unlockpt (fdm) « 0) { /* clear slave's lock flag */ 
close (fdm) ; 
return (-3); 

} 

if ((ptr = ptsname(fdm)) == NULL) { /* get slave's name */ 
close (fdm) ; 
return (-4); 

) 

/* 

* Return name of slave. Null terminate to handle case 

* where strlen(ptr) » pts namesz. 


*/ 
strncpy(pts name, ptr, pts namesz); 
pts name[pts namesz - 1] = 'X0'; 
return(fdm); /* return fd of master */ 


) 
int 
ptys open(char *pts name) 


{ 


int fds; 


if ((fds = open(pts name, O_RDWR)) < 0) 
return (-5); 
return (fds); 


} 





在 Linux 中 ，PTY 从 设备 已 为 组 tty 所 拥有 ， 所 以 在 grantpt 中 须 做 的 一 切 是 确保 访问 权限 
是 正确 的 。 


19.4 pty fork 


现在 使 用 上 一 节 介 绍 的 两 个 函数 ptym_open 和 ptys_open， 编 写 我 们 称 之 为 pty_Eork 
的 函数 。 这 个 新 函数 具有 如 下 功能 ， 用 fork 调 用 打开 主 设备 和 从 设备 ， 创 建 作为 会 话 首 进 程 
的 子 进程 并 使 其 具有 控制 终端 。 

#include "apue.h" 


#include «termios.h» 
#include <sys/ioctl.h> /* find struct winsize on BSD systems */ 


pid t pty fork(int *ptrfdm, char *slave_name, int slave_namesz, 


const struct termios *slave_termios, 
const struct winsize *slave winsize); 


返回 值 : 子 进 程 中 返回 0， 父 进程 中 返回 子 进程 的 进程 ID ， 出 错 返 回 一 ! 


PTY 主 设备 的 文件 描述 符 通 过 Ptrizr 指 针 返 回 。 
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如 果 slave_name 不 为 空 ， 从 设备 名 就 被 存放 在 该 指针 指向 的 存储 区 中 。 调 用 者 必须 为 该 存 
储 区 分 配 空间 。 

如 果 指 针 slave_termios 不 为 空 ， 则 使 用 该 指针 所 引用 的 结构 ， 初 始 化 从 设备 的 终端 行规 程 。 
如 果 该 指针 为 空 ， 那 么 ， 系 统 把 从 设备 的 termios 结 构 设 置 为 实现 定义 的 初始 状态 。 类 似 地 ， 
如 果 slave_winsize 指 针 不 为 空 ， 那 么 按 该 指针 所 引用 的 结构 初始 化 从 设备 的 窗口 大 小 。 如 果 该 
指针 为 空 ，winsize 结 构 通 常 被 初始 化 为 0。 

程序 清单 19-4 显 示 了 该 函数 的 代码 。 它 调用 相应 的 ptym_open 和 ptys_open 函 数 ， 在 本 
书 讨论 的 四 种 平台 上 都 能 适用 。 


程序 清单 19-4 pty fork 





#include "apue.h" 
#include «termios.h» 
#ifndef TIOCGWINSZ 
#include «sys/ioctl.h» 
ftendif 


pid t 

pty fork(int *ptrfdm, char *slave name, int slave namesz, 
const struct termios *slave termios, 
const struct winsize *slave winsize) 


{ 
int fdm, fds; 
pid t pid; 
char pts name [20]; 
if ((fdm = ptym open(pts name, sizeof (pts name))) < 0) 
err Sys("can't open master pty: $s, error $d", pts name, fdm); 
if (slave name != NULL) { 
/* 


* Return name of slave. Null terminate to handle case 
* where strlen(pts name) > slave namesz. 


*/ 
strncpy (slave name, pts name, slave_namesz) ; 
Slave name[slave namesz - 1] = ’\0’; 


) 


if ((pid = fork()) « 0) { 
return(-1); 
} else if (pid == 0) { /* child */ 
if (setsid() « 0) 
err sys("setsid error"); 


/* 
* System V acquires controlling terminal on open(). 
*/ 

if ((fds = ptys open(pts name)) « 0) 

err sys("can't open slave pty"); 
close(fdm); /* all done with master in child */ 


#if defined(TIOCSCTTY) 
/* 
* TIOCSCTTY is the BSD way to acquire a controlling terminal. 
* 
/ 
if (iocti(fds, TIOCSCTTY, (char *)0) < 0) 
err SyS("TIOCSCTTY error"); 
#endif 
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/* 

* Set slave's termios and window size. 
*/ 

if (slave_termios != NULL) { 


if (tcsetattr(fds, TCSANOW, slave termios) « 0) 
err sys("tcsetattr error on slave pty"); 
) 


if (slave winsize !- NULL) { 
if (ioctl(fds, TIOCSWINSZ, slave winsize) « 0) 
err Sys("TIOCSWINSZ error on slave pty"); 
} 


/* 
* Slave becomes stdin/stdout/stderr of child. 
* 
/ 
if (dup2(fds, STDIN FILENO) != STDIN FILENO) 
err sys ("dup2 error to stdin"); 
if (dup2(fds, STDOUT FILENO) !- STDOUT FILENO) 
err syS("dup2 error to stdout"); 
if (dup2(fds, STDERR FILENO) !- STDERR FILENO) 


err SyS("dup2 error to stderr"); 
if (fds !- STDIN FILENO && fds !- STDOUT FILENO && 
fds !- STDERR FILENO) 


close (fds) ; 
return (0); /* child returns 0 just like fork() */ 
} else { /* parent */ 
*ptrfdm = fdm; /* return fd of master */ 
return (pid); /* parent returns pid of child */ 


) 
} 


在 打开 PTY 主 设备 后 ,调用 fork。 正 如 前 面 提 到 的 ， 子 进程 先 调用 setsid 建 立新 的 会 话 ， 


然后 才 调 用 ptys_open。 当 调用 setsid 时 ， 子 进程 还 不 是 一 个 进程 组 的 首 进 程 ， 因 此 执行 
9.5 节 中 列 出 的 三 个 操作 步骤 ，(a) 为 子 进程 创建 一 个 新 的 会 话 ， 它 是 该 会 话 首 进 程 ，(b) HTH 
程 创 建 一 个 新 的 进程 组 ，(c) 子 进程 断 开 与 以 前 可 能 有 的 控制 终端 的 关联 ， 于 是 不 再 有 控制 终 
端 。 在 Linux 和 Solaris 系 统 中 ， 当 调用 ptys_open 时 ， 从 设备 成 为 新 会 话 的 控制 终端 。 在 
FreeBSD 和 Mac OS X 系 统 中 ， 必 须 调用 ioct1 并 使 用 参数 TIOCSCTTY 来 分 配 一 个 控制 终端 
(Linux 也 支持 TIOCSCTTY ioct1 命 令 )。 然 后 ermios 和 winsize 这 两 个 结构 在 子 进程 中 被 
初始 化 。 最 后 从 设备 的 文件 描述 符 被 复制 到 子 进程 的 标准 输入 、 标 准 输出 和 标准 出 错 中 。 这 意 
味 着 不 管子 进程 以 后 调用 exec 执 行 何 种 进程 ， 它 都 具有 同 PTY 从 设备 〈 其 控制 终端 ) 联系 起 来 
的 上 述 三 个 描述 符 。 

在 调用 fork 后 ， 父 进程 返回 PTY 主 设备 的 描述 符 以 及 子 进程 ID。 下 一 节 将 在 pty 程 序 中 使 
用 pty_fork 函 数 。 


19.5 pty 程 序 
编写 pty 程 序 的 目的 是 为 了 用 键入 : 


pty prog argl arg2 


KRE: 


prog argi arg2 


当 我 们 用 pty 来 执行 另 一 个 程序 时 ， 该 程序 在 一 个 它 自 己 的 会 话 中 执行 ， 并 和 一 个 伪 终 端 
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连接 。 
让 我 们 查看 pty 程 序 的 源 代 码 。 程 序 清单 19-5 包 含 main 函 数 。 它 调用 上 一 节 的 pty_fork 
函数 。 
程序 清单 19-5 pty 程 序 的 main 函 数 


#include "apue.h" 

#include <termios.h> 

#ifndef TIOCGWINSZ 

#include <sys/ioctl.h> /* for struct winsize */ 
#endif 


#ifdef LINUX 
#define OPTSTR "+d:einv" 


#else 

#define OPTSTR "d:einv" 

#endif 

static void set_noecho (int); /* at the end of this file */ 
void do_driver(char *); /* in the file driver.c */ 
void loop (int, int); /* in the file loop.c */ 

int 


main(int argc, char *argv[]) 


{ 


int fdm, c, ignoreeof, interactive, noecho, verbose; 
pid t pid; 

char *driver; 

char slave_name [20]; 


struct termios orig termios; 
struct winsize size; 


interactive = 
ignoreeof = 0; 
noecho = 0; 
verbose = 0; 
driver = NULL; 


isatty (STDIN_FILENO) ; 


opterr = 0; /* don’t want getopt() writing to stderr */ 
while ((c = getopt (argc, argv, OPTSTR)) != EOF) { 
switch (c) 
case 'd': /* driver for stdin/stdout */ 
driver - optarg; 
break; 
case 'e': /* noecho for slave pty’s line discipline */ 
noecho = 1; 
break; 
case 'i': /* ignore EOF on standard input */ 
ignoreeof = 1; 
break; 
case 'n': /* not interactive */ 
interactive - 0; 
break; 
case 'v': /* verbose */ 
verbose = 1; 
break; 
case '?': 


err quit("unrecognized option: -%c", optopt); 
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} 


if (optind >= argc) 
err quit ("usage: pty [ -d driver -einv ] program [ arg ... 1"); 


if (interactive) { /* fetch current termios and window size */ 
if (tegetattr(STDIN_FILENO, &orig termios) < 0) 
err_sys("tegetattr error on stdin"); 
if (ioctl (STDIN_FILENO, TIOCGWINSZ, (char *) &size) < 0) 
err Sys("TIOCGWINSZ error"); 
pid - pty fork(&fdm, slave name, sizeof(slave name), 
&orig termios, &size); 


) eise { 
pid = pty fork(&fdm, slave name, sizeof (slave name), 


NULL, NULL); 


) 


if (pid « 0) { 
err_sys("fork error"); 


} else if (pid == 0) { /* child */ 
if (noecho) 
set_noecho (STDIN_FILENO) ; /* stdin is slave pty */ 


if (execvp(argv[optind], &argv[optind]) < 0) 
err SyS("can't execute: $s", argv[optind]); 


) 


if (verbose) { 
fprintf(stderr, "slave name = %s\n", slave_name) ; 
if (driver != NULL) 
fprintf(stderr, "driver = $sWMn", driver); 


} 


if (interactive && driver == NULL) { 
if (tty raw(STDIN FILENO) < 0) /* user's tty to raw mode */ 


err sys("tty raw error"); 
if (atexit(tty atexit) « 0) /* reset user's tty on exit */ 
err sys ("atexit error"); 


) 


if (driver) 


do driver(driver); /* changes our stdin/stdout */ 
loop(fdm, ignoreeof); /* copies stdin -» ptym, ptym -» stdout */ 
exit(0); 


) 


static void 
set noecho(int fd) /* turn off echo (for slave pty) */ 


{ 


struct termios stermios; 


if (tcgetattr(fd, &stermios) « 0) 
err Sys("tcgetattr error"); 


Stermios.c lflag &- ^(ECHO | ECHOE | ECHOK | ECHONL); 


/* 

* Also turn off NL to CR/NL mapping on output. 
*/ 

Stermios.c oflag &- ^(ONLCR); 


if (tcsetattr(fd, TCSANOW, &stermios) « 0) 
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err_sys("tcsetattr error"); 


} 





下 一 节 介绍 pty 程 序 的 不 同 用 法 时 ， 将 看 到 多 种 命令 行 的 选项 。get opt 函数 帮助 我 们 以 
协调 一 致 的 模式 分 析 命令 行 参数 。 我 们 将 在 第 21 章 更 详细 地 讨论 该 函数 。 

在 调用 pty_fork 前 ， 我们 取 termios 和 winsize 结 构 的 当前 值 ， 将 其 作为 参数 传递 给 
pty_fork。 通 过 这 种 方法 ，PTY 从 设备 具有 和 当前 终端 相同 的 初始 状态 。 

从 pty_fork 返 回 后 ， 子 进程 可 选择 地 关闭 了 PTY 从 设备 的 回 送 ， 并 调用 execvp 来 执行 命 
令 行 指定 的 程序 。 所 有 余下 的 命令 行 参数 将 成 为 该 程序 的 参数 。 

父 进程 可 选 地 将 用 户 终端 设置 为 原始 模式 。 在 这 种 情况 下 ， 父 进程 也 设置 退出 处 理 程序 ， 
使 得 在 调用 exit 时 复原 终端 状态 ， 下 一 节 将 讨论 do_driver 函 数 。 

接 下 来 ， 父 进程 调用 函数 1ocp ( 见 程序 清单 19-6)。 该 函数 仅仅 是 将 从 标准 输入 接收 到 的 
所 有 内 容 复制 到 PTY 主 设备 ， 并 将 PTY 主 设备 接收 到 的 所 有 内 容 复制 到 标准 输出 。 尽 管 使 用 
select 或 pol1 的 单 进程 或 多 线程 是 可 行 的 ， 但 是 为 了 有 所 变化 ， 我 们 程序 里 使 用 了 两 个 进程 。 


程序 清单 19-6 loops 





#include "apue.h" 
#define BUFFSIZE 512 


static void sig_term(int); 
static volatile sig atomic_t Sigcaught; /* set by signal handler */ 


void 
loop(int ptym, int ignoreeof) 
{ 

pid t child; 

int nread; 

char buf [BUFFSIZE]; 


if ((child = fork()) « 0) { 
err_sys ("fork error"); 
} else if (child == 0) { /* child copies stdin to ptym */ 
for (; ; ) { 
if ((nread = read(STDIN FILENO, buf, BUFFSIZE)) « 0) 
err SysS("read error from stdin"); 


else if (nread == 0) 
break; /* EOF on stdin means we're done */ 
if (writen(ptym, buf, nread) != nread) 


err_sys ("writen error to master pty"); 


) 
/* 


* We always terminate when we encounter an EOF on stdin, 
* but we notify the parent only if ignoreeof is 0. 


*f 
if (ignoreeof == 0) 
kill (getppid(), SIGTERM) ; /* notify parent */ 

exit (0); /* and terminate; child can’t return */ 
} 
/* 
* Parent copies ptym to stdout. 
*/ 
if (signal intr(SIGTERM, sig term) == SIG ERR) 
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err_sys("signal_intr error for SIGTERM"); 


for (; ; ) { 
if ((nread = read(ptym, buf, BUFFSIZE)) <= 0) 
break; /* Signal caught, error, or EOF */ 
if (writen(STDOUT FILENO, buf, nread) !- nread) 


err sys ("writen error to stdout"); 


) 
/* 


* There are three ways to get here: sig term() below caught the 
* SIGTERM from the child, we read an EOF on the pty master (which 
* means we have to signal the child to stop), or an error. 
*/ 
if (sigcaught == 0) /* tell child if it didn't send us the signal */ 
kill(child, SIGTERM); 
/* 
* Parent returns to caller. 
*/ 
) 
/* 
* The child sends us SIGTERM when it gets EOF on the pty slave or 
* when read() fails. We probably interrupted the read() of ptym. 
*/ 
static void 
sig_term(int signo) 


sigcaught = 1; /* just set flag and return */ 


} 


注意 ， 当 使 用 两 个 进程 时 ， 如 果 一 个 终止 ， 那 么 它 必 须 通知 另 一 个 。 我 们 用 SIGTERM 信 号 
进行 这 种 通知 。 


19.6 使 用 pty 程 序 


接 下 来 看 几 个 pty 程 序 的 应 用 实例 ， 并 了 解 使 用 不 同 命令 行 选项 的 必要 性 。 
如 果 使 用 Korn shell， 那 么 我 们 执行 ，; 
pty ksh 
结果 得 到 一 个 运行 在 一 个 伪 终 端 下 的 全 新 shell。 
如 果 文 件 ttyname 包 含 了 程序 清单 18-7 中 所 示 的 程序 ， 那 么 可 按 如 下 模式 执行 pty 程 序 : 


$ who 

sar :0 Oct 5 18:07 

sar pts/0 Oct 5 18:07 

sar pts/1 Oct 5 18:07 

sar pts/2 Oct 5 18:07 

sar pts/3 Oct 5 18:07 

sar pts/4 Oct 5 18:07 pts/4 是 正在 使 用 的 最 高 PTY 设 备 
$ pty ttyname 在 pty 上 运行 程序 清单 18-7 

fd 0: /dev/pts/5 pts/5 是 下 一 个 可 用 的 PTY 


fd 1: /dev/pts/5 
fd 2: /dev/pts/5 


1. utnpX (t 
6.8 节 讨论 了 记录 当前 UNIX 系 统 登 录用 户 的 utmp 文 件 。 那 么 在 伪 终 端 上 运行 程序 的 用 户 是 
否 被 认为 是 登录 了 呢 ? 如果 是 远程 登录 ，telnetd 和 rlogind， 显 然 在 伪 终 端 上 登录 的 用 户 
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应 该 在 utmp 中 有 相应 记录 项 。 但 是 ， 在 来 自 窗口 系统 或 script 之 类 的 程序 的 伪 终 端 上 运行 
shell 的 用 户 ， 是 否 应 该 在 utmp 中 有 相应 记录 项 昵 ? 对 于 这 个 问题 一 直 没 有 统一 的 认识 。 有 的 系 
统 有 记录 ， 有 的 没有 。 如 果 在 utmp 文 件 中 没有 记录 的 话 ，who(1) 程 序 一 般 不 会 显示 相应 伪 终 
端正 在 被 使 用 。 

除非 utmp 人 允许 其 他 用 户 的 写 权限 〈 这 被 认为 是 一 个 安全 漏洞 ) ， 否 则 使 用 擅 终 端的 一 般 程 
序 将 不 能 对 其 进行 写 操作 。 

2. 作业 控制 交互 

在 pty 下 运行 作业 控制 shell 时 ， 它 能 够 正常 地 运行 。 例 如 ， 

pty ksh 
在 pty 下 运行 Korn shell。 我 们 能 够 在 这 个 新 shell 下 运行 程序 并 使 用 作业 控制 ， 这 如 同 在 登录 
shell 中 一 样 。 但 如 果 在 pty 下 运行 一 个 交互 式 程序 而 不 是 作业 控制 shell， 比 如 ; 

pty cat 
在 键入 作业 控制 挂 起 字符 之 前 该 程序 的 运行 一 切 正常 。 而 在 键入 作业 控制 挂 起 字符 时 ， 作 业 控 
制 挂 起 字符 将 会 被 显示 为 ^2， 并 且 被 忽略 。 在 早期 基于 BSD 的 系统 中 ，cat 进 程 终止 ，pty 进 
程 终止 ， 回 到 初始 登录 shell。 为 了 明白 其 中 的 原因 ， 我 们 需要 检查 所 有 相关 的 进程 及 其 所 属 的 
进程 组 和 会 话 。 图 19-7 显 示 了 pty cat 运 行 时 的 结构 图 。 








图 19-7 pty cat 的 进程 组 和 会 话 


键入 挂 起 字符 (Cul-Z) 时 ， 它 被 cat 进 程 下 的 行规 程 模块 所 识别 ， 这 是 因为 pty 将 终端 
(在 pty 父 进程 之 下 ) 设置 为 原始 模式 。 但 内 核 不 会 停止 cat 进 程 ， 这 是 因为 它 属 于 一 个 孤儿 进 
程 组 〈 见 9.10 节 )。cat 的 父 进程 是 pty 父 进程 ， 它 属于 另 一 个 会 话 。 

历史 上 ， 不 同 的 系统 处 理 这 种 情况 的 方法 也 不 同 。POSIX.1 只 是 说 明 SIGTSTP 信 号 不 能 被 
发 送 给 进程 。 而 4.3BSD 派 生出 的 系统 向 进程 递送 一 个 它 不 能 捕获 的 SIGKILL 信 号 。4.4BSD 改 
变 了 这 种 做 法 ， 转 而 采用 遵循 POSIX.1 的 处 理 方法 。 如 果 SIGTSTP 信 号 具有 默认 配置 ， HAS 
递 给 孤儿 进程 组 中 的 一 个 进程 ， 那 么 内 核 无 声息 地 丢弃 SIGTSTP 信 号 。 大 多 数 当 前 的 实现 都 采 
用 这 种 处 理 模式 。 
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当 使 用 pty 来 运行 作业 控制 shell 时 ， 被 这 个 新 shell 调 用 的 作业 决 不 会 是 任何 孤儿 进程 组 的 
成 员 ， 这 是 因为 作业 控制 shell 总 是 属于 同一 个 会 话 。 在 这 种 情况 下 ， 键 和 的 Ctrl+Z 被 发 送 到 由 
shell 调 用 的 进程 ， 而 不 是 shel 本 身 。 

让 被 pty 调 用 的 进程 能 够 处 理 作业 控制 信号 的 唯一 的 方法 是 ， 另 外 增加 一 个 pty 命 令 行 标 
志 ， 使 pty 子 进程 自己 能 够 识别 作业 挂 起 字符 (在 pty 子 进程 中 ) ， 而 不 是 让 该 字符 穿越 所 有 路 
程 而 送 至 另 一 个 行规 程 模块 。 

3. 检查 长 时 间 运 行程 序 的 输出 

另 一 个 使 用 pty 进 行 作业 控制 交互 的 例子 见 图 19-6。 如 果 运 行 一 个 缓慢 地 产生 输出 的 程序 : 

pty slowout > file.out & 

当 子 进程 试图 从 标准 输入 (终端) 读 人 数据 时 ，pty 进 程 立刻 停止 运行 。 这 是 因为 该 作业 是 一 
个 后 台 作 业 ， 并 且 当 它 试 图 访问 终端 时 会 使 作业 控制 停止 。 如 果 将 标准 输入 重 定向 使 得 pty 不 
从 终端 读 取 数据 ， 如 : 

pty slowout < /dev/null > file.out & 
那么 pty 程 序 也 立即 停止 ， 这 是 因为 它 从 标准 输入 读 取 到 一 个 文件 结束 符 。 解 决 这 个 问题 的 方 
法 是 使 用 -i 选 项 ， 其 含义 是 忽略 来 自 标 准 输入 的 文件 结束 符 ， 

pty -i slowout < /dev/null > file.out & 

这 个 标志 导致 在 遇 到 文件 结束 符 时 ， 程 序 清单 19-6 的 pty 子 进程 终止 ， 但 子 进程 不 会 告诉 父 进 
程 也 终止 。 相 反 ， 父 进程 一 直 在 将 PTY 从 设备 的 输出 复制 到 标准 输出 〈 本 例 中 的 file.out)。 

4. script 程 序 

利用 pty 程 序 ， 可 以 用 下 面 的 shell 脚 本 实现 script(1) 程 序 : 

#!/bin/sh 

pty "${SHELL:-/bin/sh}" | tee typescript 


一 旦 执行 这 个 shell 脚 本 ， 即 可 运行 ps 命令 来 观察 进程 之 间 的 关系 。 图 19-8 详 细 地 显示 了 这 些 关系 。 


typescript 文 件 





图 19-8 script shell 脚 本 


在 这 个 例子 中 ， 假 设 SHELL 变 量 是 Korm shell (可 能 是 /bin/Kkshi)。 如 前 面 所 述 ，script 仅 仅 
是 将 新 的 shell (和 它 调用 的 所 有 的 子 进程 ) 的 输出 复制 出 来 ， 但 是 因为 PTY 从 设备 之 上 的 行规 
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程 模块 通常 允许 回 送 ， 所 以 绝 大 多 数 键入 都 被 写 到 typescript 文 件 中 。 

5. 运行 协同 进程 

在 图 15-4 中 ,协同 进程 不 能 使 用 标准 WO 函数 ， 其 原因 是 标准 输入 和 输出 不 指向 终端 ， 其 输 
人 和 人 和 输出 将 被 放 到 缓冲 区 中 。 如 果 用 

if (execl("./pty", "pty", "-e", "add2", (char *)0) < 0) 
TA 

if (execl("./add2", "add2", (char *)0) « 0) 
在 pty 下 运行 协同 进程 ， 即 使 协同 进程 使 用 了 标准 IO ， 该 程序 仍然 可 以 正确 运行 。 

图 19-9 显 示 了 在 使 用 伪 终 端 作 为 协同 进程 的 输入 和 输出 时 ， 进 程 之 间 的 关系 。 这 是 图 19-5 
的 扩充 ， 它 显示 了 所 有 的 进程 间 联 系 和 数据 流 。 框 中 的 “实施 驱动 的 程序 ”是 按 前 面 的 说 明 更 
改 了 exec1 的 图 1S-4。 


fork, exec 








p 实施 驱动 的 程序 











图 19-9 运行 一 协同 进程 ， 以 伪 终 端 作为 其 输入 和 输出 


这 一 实例 显示 了 对 于 pty 程 序 ，-e (不 回 送 ) 选项 的 重要 性 。 因 为 pty 的 标准 输入 不 连接 
到 终端 ， 所 以 它 不 以 交互 方式 运行 。 在 程序 清单 19-5 中 ，interactive 标 志 默认 为 false， 这 
是 因为 对 isatty 调 用 的 返回 是 false。 这 意味 着 在 真正 终端 之 上 的 行规 程 保 持 在 规范 模式 下 ， 
并 人 允许 回 送 。 指 定 -e 选 项 后 ， 关 掉 了 PTY 从 设备 上 的 行规 程 模 块 的 回 送 。 如 果 不 这 样 做 ， 则 键 
入 的 每 一 个 字符 都 将 被 两 个 行规 程 模块 回 送 两 次 。 

我 们 也 用 -e 选 项 关闭 termios 结 构 的 oONLCR 标 志 ， 以 防止 所 有 的 协同 进程 的 输出 被 回 车 
和 换行 符 终止 。 

在 不 同 的 系统 上 测试 这 个 例子 ， 会 遇 到 14.8 节 中 描述 readn 和 writen 函 数 时 顺便 提 到 的 
同样 问题 。 当 描述 符 不 是 引用 普通 磁盘 文件 ， 从 read 返 回 时 ， 读 到 的 数据 量 可 能 因 实 现 的 不 
同 而 有 所 区 别 。 使 用 pty 的 协同 进程 产生 了 非 预期 的 结果 ， 其 原因 可 追溯 至 图 15-4 程 序 中 读 管 
道 的 read 函 数 ， 它 返回 的 结果 不 到 一 行 。 解 决 方法 是 不 使 用 图 15-4 的 程序 ， 而 是 使 用 修改 过 的 
使 用 标准 IO 库 的 习题 15.5 的 程序 版 本 ， 它 将 两 个 管道 的 标准 IO 流 都 设置 为 行 缓冲 。 这 样 ， 
fgets 函 数 将 会 一 直 读 完 一 个 整 行 。 图 15-4 中 的 whi le 循环 假设 送 到 协同 进程 的 每 一 行 都 会 带 
来 一 行 的 返回 结果 。 
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6. 用 非 交互 模式 驱动 交互 式 程序 

虽然 让 pty 运 行 任 一 协同 进程 的 想法 是 非常 诱 人 的 ， 但 即使 协同 进程 只 是 交互 式 的 ， 它 都 
不 能 正常 工作 。 问 题 在 于 pty 只 是 将 其 标准 输入 中 的 任何 内 容 复制 到 PTY， 并 将 来 自 PTY 的 任 
何 内 容 复制 到 标准 输出 ， 而 并 不 关心 具体 发 送 或 得 到 什么 数据 。 

举 个 例子 ， 我们 可 以 在 pty 之 下 运行 Lelnet 命 令 ， 直 接 与 远程 主机 会 话 : 

pty telnet 192.168.1.3 
这 样 做 与 直接 键入 telnet 192.168.1.3 相 比 ， 并 没有 带 来 什么 好 处 ， 但 我 们 可 能 希望 在 一 个 
脚本 中 运行 Lelnet 程 序 ， 其 目的 很 可 能 是 要 检验 远程 主机 的 某 些 条 件 。 如 果 telnet . cmd 文件 
包括 下 面 4 行 : 

aai 


uptime 
exit 


第 1 行 是 登录 到 远程 主机 时 使 用 的 用 户 名 ， 第 2 行 是 口令 字 ， 第 3 行 是 希望 运行 的 命令 ， 第 4 行 终 
止 此 会 话 。 如 果 按 下 列 方式 运行 此 脚本 

pty -i < telnet.cmd telnet 192.168.1.3 
那么 ， 它 不 像 我 们 所 想 的 那样 操作 。 所 发 生 的 是 celnet . cmd 文件 的 内 容 还 没有 等 到 机 会 提示 
我 们 输入 账户 名 和 口令 之 前 ， 就 被 送 到 了 远程 主机 。 当 它 关 闭 回 显 而 读 口令 时 ，1ogin 使 用 
tcsetattr 选 项 ， 于 是 技 弃 了 已 在 队列 中 的 所 有 数据 。 这 样 一 来 ,我 们 发 送 的 数据 就 被 丢掉 了 。 

当 以 交互 方式 运行 telnet 程 序 时 ， 我 们 等 待 远程 主机 发 出 输入 口令 的 提示 ， 然 后 再 键入 
口令 ， 但 是 pty 程 序 不 知道 这 样 做 。 这 就 是 为 什么 我 们 需要 一 个 比 pty 更 巧妙 的 程序 ， 如 
expect， 来 从 脚本 文件 驱动 交互 式 程序 。 

即使 如 前 所 示 那 样 从 图 15-4 运 行 pty， 这 也 没有 任何 帮助 。 这 是 因为 图 15-4 的 程序 认为 它 
在 一 个 管道 写 入 的 每 一 行 都 会 在 另 一 个 管道 产生 一 行 。 对 于 一 个 交互 式 程序 ， 输 入 一 行 可 能 产 
生 多 行 输出 。 更 进一步 ， 图 15-4 的 程序 在 从 协同 进程 读 之 前 ， 总 是 先 送 一 行 给 该 进程 。 在 送 给 
协同 进程 一 些 数据 之 前 ， 我 们 不 可 能 从 协同 进程 处 读 。 

有 一 些 从 shell 脚 本 驱动 交互 式 程序 的 方法 。 可 以 在 pty 上 增加 一 种 命令 语言 和 一 个 解释 器 。 
但 是 一 个 适当 的 命令 语言 可 能 十 倍 于 pty 程 序 的 大 小 。 另 一 种 方案 是 使 用 命令 语言 并 用 
pty_fork 消 数 来 调用 交互 式 程序 ， 这 正 是 expect 程 序 所 做 的 。 

我 们 将 采用 一 种 不 同 的 途径 ， 使 用 选项 -da 使 bpty 程 序 的 输入 和 输出 与 驱动 进程 连接 起 来 。 
该 驱动 进程 的 标准 输出 是 Pty 的 标准 输入 ， 反 之 亦 然 。 这 有 点 儿 像 协同 进程 ， 只 是 在 pty 的 
“ 另 一 边 ”。 此 种 进程 结构 与 图 19-9 中 所 示 的 几乎 相同 ， 但 是 在 这 种 场景 中 ， 由 pty 来 完成 驱动 
进程 的 fork 和 exec。 而 且 我 们 在 pty 和 驱动 进程 之 间 使 用 一 个 双向 的 流 管道 ， 而 不 是 两 个 半 
双 工 管道 。 

程序 清单 19-7 是 4o_driver 函 数 的 源码 ， 在 使 用 -a 选项 时 ， 该 函数 被 pty ( 见 程序 清单 
19-5) 的 main 函 数 调 用 。 


程序 清单 19-7 pty 程 序 的 do_driver 范 数 
#include "apue.h" 


void 
do_driver (char *driver) 
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pid t child; 


int pipe [2]; 

/* 

* Create a stream pipe to communicate with the driver. 
*/ 


if (s pipe(pipe) « 0) 
err sys("can't create stream pipe"); 


if ((child = fork()) < 0) { 
err sys("fork error"); 

} else if (child == 0) { /* child */ 
close (pipe[1]); 


/* stdin for driver */ 
if (dup2 (pipe{0], STDIN FILENO) != STDIN FILENO) 
err sys("dup2 error to stdin"); 


/* stdout for driver */ 


if (dup2(pipe[0], STDOUT FILENO) !- STDOUT FILENO) 
err sys("dup2 error to stdout"); 
if (pipe[0] != STDIN FILENO && pipe[0] !- STDOUT FILENO) 


close (pipe[0]); 


/* leave stderr for driver alone */ 
execlp (driver, driver, (char *)0); 
err sys("execlp error for: $s", driver); 


) 


close (pipe[0]); /* parent */ 
if (dup2(pipe[1], STDIN FILENO) !- STDIN FILENO) 
err sys("dup2 error to stdin"); 
if (dup2(pipe[1], STDOUT FILENO) !- STDOUT FILENO) 
err sys("dup2 error to stdout"); 
if (pipe[1] !- STDIN FILENO && pipe[1] !- STDOUT FILENO) 


close (pipe[1]); 
/* 


* Parent returns, but with stdin and stdout connected 
* to the driver, 
*/ 

} 





通过 我 们 自己 编写 由 pty 调 用 的 驱动 程序 ， 可 以 按 所 希望 的 方式 驱动 交互 式 程序 。 即 使 驱 
动 程序 有 和 pty 连 接 在 一 起 的 标准 输入 和 标准 输出 ， 它 仍然 可 以 通过 读 、 写 /aev/tty 同 用 户 
交互 。 这 个 解决 方法 仍 不 如 expect 程 序 通用 ， 但 是 它 用 不 到 50 行 的 代码 ， 提 供 了 一 种 可 选 的 
方案 。 


19.7 高 级 特性 


伪 终 端 还 有 其 他 特性 ， 我 们 在 这 里 简略 提 一 下 。Sun Microsystems[2002] 和 BSD pty(4) 的 
手册 页 对 此 有 更 详细 的 说 明 。 

1. 打包 模式 

打包 模式 (packet mode) 能 够 使 PTY 主 设备 了 解 到 PTY 从 设备 的 状态 变化 。 在 Solaris 系 统 
中 ， 可 以 将 流 模块 pckt 压 人 PTY 主 设备 端 来 设置 这 种 模式 。 图 19-2 显 示 了 这 种 可 选 模块 。 在 
FreeBSD, LinuxfüMac OS X 中 ， 可 以 用 TIOCPKT ioct1 命 令 来 设置 这 种 模式 。 
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Solaris 和 其 他 平台 相 比较 ， 有 具体 的 打包 模式 有 所 不 同 。 在 Solaris 中 ， 读 取 PTY 主 设备 的 进 
程 必须 调用 ge tmsg 从 流 首 取得 消息 ， 这 是 因为 pckt 模 块 将 一 些 事 件 转 化 为 无 数据 的 
STREAMS 消 息 。 在 其 他 平台 ， 每 一 次 对 PTY 主 设备 的 read 操 作 都 会 在 返回 状态 字 节 后 跟随 可 
选 的 数据 。 

无 论 实现 细节 如 何 ， 打 包 模 式 的 目的 是 ， 当 PTY 从 设备 之 上 的 行规 程 模块 出 现 以 下 事件 时 ， 
通知 进程 从 PTY 主 设备 读 取 数 据 : 读 队 列 被 刷新 ， 写 队列 被 刷新 ， 输 出 被 停止 (如 : 
Ctrl-S) ， 输出 重新 开始 ，XON/XOFF 流 控制 被 关闭 后 重新 启用 ，XON/XOFF 流 控制 被 启用 后 
重新 关闭 。 这 些 事件 被 rlogin 客 户 进程 和 *logind 服 务 器 进程 等 使 用 。 

2. 远程 模式 

PTY 主 设备 可 以 用 TIOCREMOTE ioct1 命 令 将 PTY 从 设备 设置 成 远程 模式 。 虽 然 FreeBSD 
5.2.1, Mac OS X 10.3 和 Solaris 9 使 用 同样 的 命令 来 打开 或 关闭 这 个 特性 ， 但 是 在 Solaris 中 ， 
ioct1 的 第 三 个 参数 是 一 个 整 型 数 ， 而 在 FreeBSD 和 Mac OS X 中 是 一 个 指向 整 型 数 的 指针 。 
(Linux 2.4.22 不 支持 这 一 命令 。) 

当 PTY 主 设备 将 PTY 从 设备 设置 成 这 种 模式 时 ， 它 通知 PTY 从 设备 之 上 的 行规 程 模 块 对 从 
主 设备 接收 到 的 任何 数据 都 不 进行 任何 处 理 ， 不 管 从 设备 termios 结 构 中 的 规范 或 非 规范 标志 
是 否 设置 。 远 程 模式 适用 于 窗口 管理 器 这 种 进行 自己 的 行 编辑 的 应 用 程序 。 

3. 窗口 大 小 变化 

PTY 主 设备 之 上 的 进程 可 以 用 TIOCSWINSZ ioct1 命 令 来 设置 从 设备 的 窗口 大 小 。 如 果 新 
的 大 小 和 旧 的 不 同 ，SIGWINCH 信 号 将 被 发 送 到 PTY 从 设备 的 前 台 进 程 组 。 

4. 信号 发 生 

读 、 写 PTY 主 设备 的 进程 可 以 向 PTY 从 设备 的 进程 组 发 送信 和 号。 在 Solaris 9 中 ， 可 以 用 
TIOCSIGNAL ioct1 命 令 做 到 这 一 点 ， 该 命令 的 第 三 个 参数 就 是 信号 编号 。 在 FreeBSD 5.2.1 
和 Mac OS X 10.341, JHTIOCSIG ioct1 来 做 到 这 一 点 ， 它 的 第 三 个 参数 是 指向 信号 编号 值 的 
Bet, (Linux 2.4.22 不 支持 这 一 ioct1 命 令 。) 


19.8 小 结 


本 章 开 始 部 分 扼要 叙述 了 如 何 使 用 伪 终 端 并 观察 了 某 些 应 用 实例 。 接 着 ， 分 析 说 明了 在 本 
书 讨论 的 四 种 平台 上 打开 伪 终 端 所 需 的 代码 ， 然 后 用 此 代码 提供 了 通用 的 pty_fork 函 数 ， 它 
可 用 于 多 种 不 同 的 应 用 。 该 函数 是 小 程序 pty 的 基础 。 我 们 使 用 pty 揭 示 了 伪 终 端的 许多 属性 。 

伪 终 端 在 大 多 数 UNIX 系 统 中 每 天 都 被 用 来 进行 网 络 登 录 。 我 们 检查 了 伪 终 端的 许多 其 他 
用 途 ， 从 script 程 序 到 使 用 批 处 理 脚本 来 驱动 交互 式 程序 等 。 


习题 

19.1 当 用 telnet 或 r1ogin 远 程 登 录 到 一 个 BSD 系 统 上 时 ， 像 我 们 在 19.3.2 节 讨论 过 的 那样 ， 
PTY 从 设备 的 所 有 权 和 权限 被 设置 。 该 过 程 是 如 何 发 生 的 ? 

19.2 在 BSD 系 统 上 修改 程序 清单 19-2 中 的 grantpt 函 数 ， 使 之 调用 一 个 设置 用 户 ID 程 序 来 改 
变 PTY 从 设备 的 所 有 权 和 权限 (类似 于 Solaris 中 的 grantpt 函 数 所 做 的 那样 )。 


19.3 使 用 pty 程 序 来 决定 你 的 系统 用 来 初始 化 PTY 从 设备 的 termios 结 构 和 winsize 结 构 
的 值 。 
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19.4 
19.5 


19.6 
19.7 


19.8 


19.9 


重 写 1oop 函 数 ( 见 程序 清单 19-6)， 使 之 成 为 使 用 select 或 poll 的 单个 进程 。 
在 子 进程 中 ，pty_fork 返 回 后 ， 标 准 输入 、 标 准 输出 和 标准 出 错 都 以 读 写 模 式 打 开 。 
能 够 将 标准 输入 变 成 只 读 ， 另 两 个 变 成 只 写 吗 ? 

在 图 19-7 中 ， 指 出 哪个 进程 组 是 前 台 的 ， 哪 个 进程 组 是 后 台 的 ， 并 指出 会 话 首 进 程 。 
在 图 19-7 中 ， 当 键入 文件 终止 符 时 ， 进 程 终止 的 顺序 是 什么 ?如 果 可 能 的 话 ， 用 进程 会 
计 信 息 验证 之 。 

script(1) 程 序 通 常 在 输出 文件 头 增加 一 行 说 明 它 的 开始 时 间 ， 在 输出 文件 末尾 增加 一 
行 说 明 它 的 结束 时 间 。 将 这 个 特性 加 到 本 章 简单 的 shell 脚 本 中 。 

解释 为 什么 在 下 面 的 例子 中 ,文件 aata 的 内 容 被 输出 到 终端 上 ， 奉 什么 时 候 程序 
ttyname 只 产生 输出 而 从 不 读 取 输 入 。 

$ cat data 一 个 有 两 行 的 文件 

hello, 

Ries -i < data ttyname -i 表示 忽略 stdin 的 文件 结束 标志 

hello, 这 两 行 来 自 何 处 ? 

es /dev/ttyp5 我 们 期 望 ttyname 输 出 这 三 行 


fd 1: /dev/ttyp5 
fd 2: /dev/ttyp5 


19.10 编写 一 个 调用 pty_fork 的 程序 ， 该 程序 用 子 进 程 exec 另 一 个 你 必须 编写 的 程序 。 后 面 


这 道 新 程序 能 够 捕获 SIGTERM 和 SIGWINCH。 当 捕获 到 信号 时 ， 要 打印 出 有 关 消 息 ， 并 
且 对 于 后 一 种 信号 ， 还 要 打印 终端 窗口 大 小 。 然 后 让 父 进程 用 19.7 节 描述 过 的 ioct1 向 
PTY 从 设备 的 进程 组 发 送 SIGTERM 信 号 。 从 PTY 从 设备 读 回 消 息 ， 验 证 捕获 的 信号 。 接 
下 来 由 父 进 程 设 置 PTY 从 设备 窗口 的 大 小 ， 并 读 回 PTY 从 设备 的 输出 。 让 父 进程 退出 并 
确定 是 否 PTY 从 设备 进程 也 终止 了 ， 如 果 它 也 终止 了 ， 请 解释 它 何以 终止 。 
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Bis Pe PAE 
20.1 引言 


20 世 纪 80 年 代 早期 ，UNIX 系 统 被 认为 不 是 一 个 适合 运行 多 用 户 数据 库 系 统 的 环境 OL 
Stonebraker[1981] 和 Weinberger[1982])。 早 期 的 系统 (如 V7)， 因 为 没有 提供 任何 形式 的 IPC 机 
fill (除了 半 双 工 管道 )， 也 没有 提供 任何 形式 的 字 节 范围 锁 机 制 ， 所 以 确实 不 适合 运行 多 用 户 
数据 库 系统 。 但 是 ， 这 些 缺 陷 中 的 大 多 数 都 已 得 到 纠正 。 到 了 20 世 纪 80 年 代 后 期 ，UNIX 系 统 
已 为 运行 可 靠 的、 多 用 户 的 数据 库 系统 提供 了 一 个 适合 的 环境 。 自 那 时 以 来 很 多 商业 公司 都 已 
提供 这 种 数据 库 系 统 。 

本 章 将 开发 一 个 简单 的 、 多 用 户 数据 库 的 C 函 数 库 。 调 用 此 函数 库 提供 的 C 语 言 函 数 ， 其 他 
程序 可 以 读 取 和 存储 数据 库 中 的 记录 。 这 个 C 函 数 库 通常 只 是 一 个 完整 的 数据 库 系 统 的 一 部 分 ， 
这 里 并 不 开发 其 他 部 分 (如 查询 语言 等 )， 关 于 其 他 部 分 可 以 参阅 专门 介绍 数据 库 系 统 的 教科 
书 。 我 们 感 兴趣 的 是 数据 库 函 数 库 与 UNIX 系 统 的 接口 ， 以 及 这 些 接口 与 前 面 各 章节 所 涉及 主 
题 的 关系 (如 14.3 节 的 字 节 范围 锁 )。 


20.2 历史 


dbm(3) 是 在 UNIX 系 统 中 很 流行 的 数据 库 函 数 库 ， 它 由 Ken Thompson 开 发 ， 使 用 了 动态 散 
列 结构 。 最 初 ， 它 与 V7 一 起 提供 ， 并 出 现在 所 有 BSD 版 本 中 ， 也 包含 在 SVR4 的 BSD 兼 容 函 数 
库 中 [AT&T 1990c]。BSD 的 开发 者 扩充 了 dbm 函 数 库 ， 并 将 它 称 为 ndabm。ndbm 函 数 库 包括 在 
BSD 和 SVR4 中 。ndbm 函 数 被 标准 化 后 成 为 Single UNIX Specification 的 XSI 扩 展 部 分 。 

Seltzer 和 Yigit[1991] 中 详细 介绍 了 dbm 函 数 库 使 用 的 动态 散 列 算法 的 历史 ， 以 及 这 个 库 的 其 
他 实现 方法 (例如 ，dbm 函 数 库 的 GNU 版 本 gdbm)。 但 是 ， 所 有 这 些 实现 的 一 个 根本 缺点 是 : 
它们 都 不 支持 多 个 进程 对 数据 库 的 并 发 更 新 。 它 们 都 没有 提供 并 发 控制 (如 记录 锁 )。 

4.4BSD 提 供 了 一 个 新 的 库 一 一 ab(3)， 该 库 支 持 三 种 不 同 的 访问 模式 : 面向 记录 、 散 列 和 
B- 树 。 同 样 ，ab(3) 也 设 有 提供 并 发 控制 〈 这 一 点 在 ab(3) 手 册页 的 BUGS 部 分 中 说 得 很 清楚 ) 。 


Sleepycat Software (http://www.sleepycat.com) 提供 了 几 个 db 函数 摩 版 本 ， 它 们 支持 并 发 访问 、 俏 和 
*4. 


绝 大 部 分 商用 数据 库 函 数 库 提 供 多 进程 同时 更 新 数据 库 所 需要 的 并 发 控制 。 这 些 系统 一 般 
都 使 用 14.3 节 中 介绍 的 建议 记录 锁 ， 但 是 ， 它 们 也 常常 实现 自己 的 锁 原 语 ， 以 避免 为 获得 一 把 
无 竞争 的 锁 而 需 的 系统 调用 开销 。 这 些 商用 系统 通常 用 B+ 树 [Comer 1979]， 或 者 某 种 动态 散 列 
技术 (例如 线性 散 列 [Litwin 1980] 或 者 可 扩展 的 散 列 [Fagin et al. 1979]) 来 实现 数据 库 。 
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表 20-1 列 出 了 本 书 说 明 的 四 种 操作 系统 中 常用 的 数据 库 函 数 库 。 注 意 在 Linux 上 ，gdqbm 库 


既 支 持 dbm 函 数 库 ， 又 支持 ndbm 函 数 库 。 
表 20-1 多 种 平台 支持 的 数据 库 函 数 库 


FreeBSD Linux Mac OS X pä 
POSIX.1 
| 521 242 O3 9 | 2.4.22 10.3 
gdbm 
ndbm d 


20.3 RAE 


本 章 开发 的 函数 库 类 似 于 naibm 函 数 库 ， 但 增加 了 并 发 控制 机 制 ， 从 而 允许 多 进程 同时 更 
新 同一 数据 库 。 本 节 将 进 述 数据 库 函 数 库 的 C 语 言 接口 ， 下 一 节 再 讨论 其 实际 的 实现 。 

当 打 开 数 据 库 时 ， 通 过 返回 值得 到 代表 数据 库 的 句柄 (一 个 难以 理解 的 指针 (opaque 
pointer) ) 。 此 句柄 将 作为 参数 传递 给 其 他 数据 库 函 数 。 


#include “apue_db.h" 













DBHANDLE db open(const char *pathname, int oflag, ... /* int mode */); 


返回 值 : 车 成 功 则 返回 数据 库 名 柄 ， 若 出 错 则 返回 NULL 





void db close(DBHANDLE db); 


如 果 db_open 成 功 返 回 ， 则 将 建立 两 个 文件 : pathname.idxfüpathname.dat, pathname.idx 
是 索引 文件 ，pathname.dat 是 数据 文件 。open 的 第 二 个 参数 oflag ( 见 3.3 节 ) 指定 这 些 文件 的 打 
FRA (只 读 、 读 / 写 或 如 杂文 件 不 存在 则 创建 等 )。 如 果 需 要 建立 新 的 数据 库 文件 ，mode 将 作 
为 第 三 个 参数 传递 给 open (文件 访问 权限 )。 

当 不 再 使 用 数据 库 了 时 ， 调 用 db_close 来 关闭 数据 库 。db_close 将 关闭 索引 文件 和 数据 
文件 ， 并 释放 数据 库 使 用 过 程 中 分 配 到 的 所 有 用 于 内 部 缓冲 的 存储 空间 。 

当 向 数据 库 中 加 入 一 条 新 的 记录 时 ， 必 须 指明 此 记录 的 键 ， 以 及 与 此 键 相 联系 的 数据 。 如 
果 此 数据 库存 储 的 是 人 事 信 息 ， 键 可 以 是 雇员 ID 号 ， 数 据 可 以 是 此 雇员 的 姓名 、 地 址 、 电 话 号 
码 以 及 受聘 日 期 等 等 。 我 们 的 实现 要 求 每 条 记录 的 键 必 须 是 唯一 的 〈 例 如 ， 两 条 雇员 记录 不 能 
有 同样 的 雇员 ID 号 ) 。 


#include "apue db.h" 


int db store(DBHANDLE db, const char *key, const char *data, 


int flag); 
返回 值 ， 车 成 功 则 返回 9， 车 出 错 则 返回 非 0 值 ( 见 下 ) 





参数 key 和 data 是 由 null 结 束 的 字符 串 。 它 们 可 以 包含 除了 nuli 外 的 任何 字符 ， 如 换行 符 。 

flag 参 数 只 能 是 DB_INSERT (加 一 条 新 记录 )、DB_REPLACE (替换 一 条 已 有 的 记录 ) 或 
DB STORE (加 一 条 新 记录 或 蔡 换 一 条 已 有 的 记录 ， 只 要 合适 无 论 哪 一 种 都 可 以 )。 这 三 个 常 
数 定义 在 apue_qdb.h 头 文件 中 。 如 果 使 用 DB_INSERT 或 DB_STORE， 并 且 记 录 并 不 存在 ， 则 
加 入 一 条 新 记录 ， 如果 使 用 DB_REPLACE 或 DBB_STORE， 并 且 该 记录 已 经 存在 ， 则 用 新 记录 蔡 
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换 已 存在 的 原 记 录 ， 如 果 使 用 DB_REPLACE， 而 记录 不 存在 ， 则 errno 设 置 为 ENOENT ， 返 回 
值 为 -1， 并 且 不 加 入 新 记录 ， 如 果 使 用 DB_INSERT， 而 记录 已 经 存在 ， 则 不 加 入 新 记录 ， 返 
回 值 为 1， 在 这 里 ， 返 回 1 以 区 别 于 一 般 的 出 错 返回 (71). 

通过 提供 键 key 可 以 从 数据 库 中 取出 一 条 记录 。 


#include "apue db.h" 


char *db fetch(DBHANDLE db, const char *key); 





返回 值 : 车 成 功 则 返回 指向 数据 的 指针 ， 若 记录 没有 找到 则 返回 NULL 


如 果 记 录 找 到 了 ， 则 返回 指向 按键 Key 存放 的 数据 的 指针 。 通 过 指明 键 Key， 也 可 以 在 数据 
库 中 删除 一 条 记录 。 

#include "apue_db.h" 

int db delete (DBHANDLE db, const char *key) ; 

返回 值 ， 车 成 功 则 返回 0， 若 记录 没有 找到 则 返回 -1 

除了 通过 键 访问 数据 库 外 ， 也 可 以 一 条 一 条 记录 地 访问 数据 库 。 为 此 ， 首 先 调用 
db_rewind 回 滚 到 数据 库 的 第 一 条 记录 ， 然 后 在 每 一 次 循环 中 调用 db_nextrec， 上 顺序 地 读 
每 条 记录 。 


#include "apue db.h" 





void db rewind(DBHANDLE db); 


char *db nextrec(DBHANDLE db, char *key); 
返回 值 ， 车 成 功 则 返回 指向 数据 的 指针 ， 若 到 达 数 据 库 的 结尾 则 返回 NULL 





如 果 key 是 非 室 的 指针 ， 则 Glb_nextrec 将 当前 记录 的 键 复制 到 key 所 指向 的 存储 区 中 。 

db_nextrec 不 保证 记录 访问 的 次 序 ， 只 保证 每 一 条 记录 被 访问 恰好 一 次 。 纵 使 顺序 地 存 
储 三 条 键 分 别 为 A、B、C 的 记录 ， 也 无 法 确定 db_nextrec 将 按 什么 顺序 返回 这 三 条 记录 。 它 
可 能 按 B、A、C 的 顺序 返回 ， 也 可 能 按 其 他 顺序 ， 实 际 的 顺序 由 数据 库 的 实现 决定 。 

这 七 个 函数 提供 了 数据 库 函 数 库 的 接口 。 接 下 来 介绍 实现 。 


20.4 实现 概述 


大 多 数 访 问 数据 库 的 函数 库 使 用 两 个 文件 来 存储 信息 ， 一 个 索引 文件 和 一 个 数据 文件 。 索 
引文 件 包含 索引 值 (BE) 和 指向 数据 文件 中 对 应 数据 记录 的 指针 。 有 许多 技术 可 用 来 组 织 索 引 
文件 ， 以 提高 按键 查询 的 速度 和 效率 ， 散 列 法 和 B+ 树 是 两 种 常用 的 技术 。 我 们 采用 固定 大 小 的 
散 列表 来 组 织 索引 文件 结构 ， 并 采用 链表 法 解决 散 列 冲 突 。 在 介绍 qb_cpen 时 ， 曾 提 到 将 创建 
两 个 文件 : 一 个 以 . idqx 为 后 缀 的 索引 文件 和 一 个 以 . dat AGRA RHEE 

这 里 将 键 和 索引 以 由 null 结 尾 的 字符 串 形式 存储 一 它们 不 能 包含 任意 的 二 进 制 数据 。 有 些 
数据 库 系 统 用 二 进 制 形式 存储 数值 数据 (例如 ， 用 1、2 或 4 个 字 节 存储 一 个 整数 ) 以 节省 存储 
空间 ， 这 样 一 来 使 函数 复杂 化 ， 也 使 数据 库 文件 在 不 同 的 平台 间 移 植 比较 困难 。 例 如 ， 网 络 上 
有 两 个 系统 使 用 不 同 的 二 进 制 格式 存储 整数 ， 如 果 想 要 这 两 个 系统 都 能 够 访问 数据 库 就 必须 解 
决 不 同 存储 格式 的 问题 〈 今 天 不 同体 系 结构 的 系统 共享 文件 已 经 很 常见 了 ) 。 按 照 字 符 串 形 式 
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存储 所 有 的 记录 (包括 键 和 数据 ) 能 使 这 一 切 变 得 简单 ， 尽 管 这 确实 需要 使 用 更 多 的 磁盘 空间 ， 
但 这 是 为 可 移植 性 付出 的 很 小 代价 。 

db_store 要 求 对 于 每 个 键 ， 只 有 一 条 对 应 的 记录 。 有 些 数 据 库 系统 允许 多 条 记录 使 用 同 
样 的 键 ， 并 提供 方法 访问 与 一 个 键 相关 的 所 有 记录 。 另 外 ， 由 于 只 有 一 个 索引 文件 ， 这 意味 着 
每 条 数据 记录 只 能 有 一 个 键 〈 不 支持 第 二 个 键 ) 。 有 些 数据 库 系统 允许 一 条 记录 拥有 多 个 键 ， 
并 且 对 每 一 个 键 使 用 一 个 索引 文件 ， 当 加 入 或 删除 一 条 记录 时 ， 要 对 所 有 的 索引 文件 进行 相应 
的 更 新 。( 一 个 有 多 个 索引 文件 的 例子 是 雇员 库 文 件 ， 可 以 将 雇员 ID 号 作为 索引 的 键 ， 也 可 以 
将 雇员 的 社会 保险 号 作为 索引 键 。 由 于 雇员 的 名 字 并 不 保证 唯一 ， 所 以 名 字 不 能 作为 键 。) 

图 20-] 是 数据 库 实 现 的 基本 结构 。 索 引文 件 由 三 部 分 组 成 : 空 困 链 表 指 针 、 散 列表 和 索引 记录 。 
在 图 20-1 中 ， 所 有 指针 (ptr) 字段 中 实际 存储 的 是 以 ASCII 码 数字 形式 记录 的 文件 中 的 偏 移 量 。 
空闲 链表 中 第 一 条 
索引 记录 的 偏 移 量 

散 列表 


oe ~ 


£N 指针 ea 


该 散 列 链表 中 第 一 条 
索引 记录 的 偏 移 量 T- 


- 
-— 
N 






索引 记录 















索引 文件 


KENN Vul. 





该 散 列 链表 中 下 一 条 
索引 记录 的 偏 移 量 





j 
is 数据 记录 长 度 | 


图 20-1 索引 文件 和 数据 文件 结构 


当 给 定 一 个 键 要 在 数据 库 中 寻找 一 条 记录 时 ，db_fetch 根 据 该 键 计算 散 列 值 ， 由 此 散 列 
值 可 确定 散 列表 中 的 一 条 散 列 链 (链表 指针 字段 可 以 为 0， 表 示 一 条 空 的 散 列 链 )。 沿 着 这 条 散 
列 链 ， 可 以 找到 所 有 具有 该 散 列 值 的 素 引 记录 。 当 遇 到 一 条 索引 记录 的 链表 指针 字段 为 0 时 ， 
表示 到 达 了 此 散 列 链 的 未 尾 。 
下 面 来 看 一 个 实际 的 数据 库 文件 。 程 序 清 单 20-1 中 的 程序 建立 了 一 个 新 的 数据 库 ， 并 且 写 
和 了 三 条 记录 。 由 于 所 有 Vp uo c 所 以 可 以 用 任何 标准 
的 UNIX 系 统 工具 来 查看 实际 的 索引 文件 和 数据 文件 。 
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$ 1s -1 db4.* 
-rw-r--r-- 1 sar 28 Oct 19 21:33 db4.dat 
-rw-r--r-- 1 sar 72 Oct 19 21:33 db4.idx 
$ cat db4.idx 
0 53 35 0 
0 10Alpha:0:6 
0 210beta:6:14 
17 1ligamma:20:8 
$ cat db4.dat 
datal 
Data for beta 
record3 


为 了 使 这 个 例子 简单 ， 将 每 个 指针 (ptr) 字段 的 大 小 定 为 4 个 ASCI 字 符 ， 将 散 列 链 的 条 数 定 为 
3。 由 于 每 一 个 ptr 记 录 的 是 一 个 文件 偏 移 量 ， 所 以 4 个 ASCI 字 符 限 制 了 一 个 索引 文件 或 数据 文 
件 的 大 小 最 多 只 能 为 10 000 字 节 。 当 在 20.9 节 做 数据 库 系统 的 性 能 测试 时 ， 将 ptr 字 段 的 大 小 设 
为 6 个 字符 (这 样 文件 大 小 可 以 达到 1 000 000 字 节 ) ， 将 散 列 链 数 设 为 100 以 上 。 
程序 清单 20-1 建立 一 个 数据 库 并 向 其 中 写 三 条 记录 
#include "apue.h" 
#include "apue_db.h" 
#include «fcntl.n» 
int 
main (void) 
DBHANDLE db; 
if ((db = db open("db4", O_RDWR | O CREAT | O TRUNC, 


FILE MODE)) == NULL) 
err sys("db open error"); 


if (db store(db, "Alpha", "datal", DB INSERT) != 0) 
err quit("db store error for alpha"); 

if (db store(db, "beta", "Data for beta", DB INSERT) != 0) 
err quit("db store error for beta"); 

if (db store(db, "gamma", "record3", DB INSERT) !- O) 


err quit("db store error for gamma"); 


db close(db); 
exit(0); 


) 
索引 文件 的 第 一 行为 : 


0 53 35 0 
分 别 为 空闲 链表 指针 (0 表示 空闲 链表 为 空 ) ， 和 三 个 散 列 链 的 指针 : 53、35 和 0。 下 一 行 ; 

0 10Alpha:0:6 
显示 了 一 条 索引 记录 的 结构 。 第 一 个 4 字符 字段 (0) 为 链表 指针 ， 表 示 这 一 条 记录 是 此 散 列 链 
的 最 后 一 条 。 下 一 个 4 字符 字段 (10) 为 索引 记录 长 度 (idx len)， 表示 此 索引 记录 剩余 部 分 的 
长 度 。 用 两 个 read 操 作 来 读 取 一 条 索引 记录 : 第 一 个 read 读 取 这 两 个 固定 长 度 的 字段 (chain 
ptr 和 idx len)， 然 后 再 根据 idx len 来 读 取 后 面 的 不 定 长 部 分 。 剩 下 的 三 个 字段 为 ， 键 (key), X 
据 记录 的 偏 移 量 (dat off) 和 数据 记录 的 长 度 (dat len)， 这 三 个 字段 用 分 隔 符 (sep) MF, dE 
这 里 使 用 的 是 冒号 。 由 于 此 三 个 字段 都 是 不 定 长 的 ， 所 以 需要 一 个 专门 的 分 隔 符 ， 而 且 这 个 分 
隔 符 不 能 出 现在 键 中 。 最 后 用 一 个 \n (换行 符 ) 结束 这 一 条 索引 记录 。 由 于 在 idqx len 中 已 经 
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有 了 记录 的 长 度 ， 所 以 这 个 换行 符 并 不 是 必需 的 ， 加 上 换行 符 是 为 了 把 各 条 索引 记录 分 开 ， 这 
样 就 可 以 用 标准 的 UNIX 系 统 工具 (如 cat 和 more) 来 查看 索引 文件 。 键 (key) 是 将 记录 加 入 
数据 库 时 指定 的 值 。 数 据 记 录 在 数据 文件 中 的 偏 移 量 为 0， 长 度 为 6。 从 数据 文件 中 可 看 到 数据 
记录 确实 从 0 开始 ， 长 度 为 6 个 字 节 。 (与 索引 文件 一 样 ， 这 里 自动 在 每 条 数据 记录 的 后 面 加 上 
一 个 换行 符 ， 以 便于 使 用 UNIX 系 统 工具 。 在 调用 dab_fetch 时 ， 此 换行 符 不 作为 数据 返回 。) 

如 果 在 这 个 例子 中 跟踪 三 条 散 列 链 ， 可 以 看 到 第 一 条 散 列 链 上 第 一 条 记录 的 偏 移 量 是 53 
(gamma) ， 这 条 链 上 下 一 条 记录 的 偏 移 量 为 17 (alpha)， 并 且 是 这 条 链 上 的 最 后 一 条 记录 。 
第 二 条 散 列 链 上 的 第 一 条 记录 的 偏 移 量 是 35 (beta)， 且 是 此 链 上 最 后 一 条 记录 。 第 三 条 散 列 
链 为 空 。 

请 注意 索引 文件 中 键 的 顺序 和 数据 文件 中 对 应 数据 记录 的 顺序 与 程序 清单 20-1 的 程序 中 调 
用 ab_store 的 顺序 相同 。 由 于 在 调用 ab_open 时 使 用 了 co_TRUNC 标 志 ， 索 引文 件 和 数据 文件 
都 被 截断 ， 整 个 数据 库 相 当 于 重新 初始 化 。 在 这 种 情形 下 ，db_store 将 新 的 索引 记录 和 数据 
记录 添加 到 对 应 的 文件 末尾 。 后 面 将 看 到 Gb_store 也 可 以 重复 使 用 这 两 个 文件 中 因 删 除 记 录 
而 生成 的 空间 。 

对 于 索引 文件 使 用 固定 大 小 的 散 列表 是 一 个 折 中 ， 当 每 个 散 列 链 都 不 太 长 时 ， 这 种 方法 能 
保证 快速 地 查找 。 我 们 的 目的 是 能 够 快速 地 查找 任 一 键 ， 同 时 又 不 使 用 太 复 杂 的 数据 结构 ， 如 
B- 树 或 动态 可 扩充 散 列表 。 动 态 可 扩充 散 列表 的 优点 是 能 保证 仅 用 两 次 磁盘 操作 就 能 找到 数据 
记录 ( 详 见 Litwin [1980] 或 Fagin et al. [1979]) 。B- 树 能 够 用 (已 排序 的 ) 键 的 顺序 来 遍历 数据 
E (采用 散 列表 的 db_nextrec 函 数 就 做 不 到 这 一 点 )。 


20.5 集中 式 或 非 集中 式 


当 有 多 个 进程 访问 同一 数据 库 时 ， 有 两 种 方法 可 实现 库 函数 : 

(1) 集中 式 。 由 一 个 进程 作为 数据 库 管 理 者 ， 所 有 的 数据 库 访 问 工作 由 此 进程 完成 。 其 他 
进程 通过 IPC 机 制 与 此 中 心 进程 进行 联系 。 

(2) 非 集中 式 。 每 个 库 函 数 独 立 申请 并 发 控制 (加 锁 )， 然 后 自己 调用 VO 函数 。 

使 用 这 两 种 技术 的 数据 库 系统 都 有 。 如 果 有 适当 的 加 锁 例 程 ， 因 为 避免 了 使 用 IPC， 那 么 
非 集中 式 方法 一 般 要 快 一 些 。 图 20-2 描 绘 了 集中 式 方 法 的 操作 。 

图 中 特意 表示 出 IPC 像 绝 大 多 数 UNIX 系 统 的 消息 传送 一 样 需要 经 过 操作 系统 内 核 (15.9 节 
中 说 明 的 共享 存储 不 需要 这 种 经 过 内 核 的 复制 )。 可 以 看 出 ， 在 集中 式 方 法 下 ， 中 心 控 制 进程 
将 记录 读 出 ， 然 后 通过 IPC 机 制 将 数据 传送 给 请 求 进程 ， 这 是 这 种 设计 的 不 足 之 处 。 注 意 ， 集 
中 式 数 据 库 管理 进程 是 唯一 对 数据 库 文件 进行 WO 操作 的 进程 。 , 

集中 式 的 优点 是 能 够 根据 需要 来 对 操作 模式 进行 调整 。 例 如 ， 可 以 通过 中 心 进程 给 不 同 的 
进程 赋予 不 同 的 优先 级 ， 这 会 影响 到 中 心 进程 对 IO 操作 的 调度 。 而 用 非 集中 式 方法 则 很 难 做 到 
这 一 点 。 在 这 种 情况 下 只 能 依赖 于 操作 系统 内 核 的 磁盘 IO 调度 策略 和 加 锁 策略 (也 就 是 说 ， 当 
三 个 进程 同时 等 待 一 个 锁 开 锁 时 ， 哪 个 进程 下 一 个 得 到 锁 ? ) 。 

集中 式 方 法 的 另 一 个 优点 是 ， 复 原 要 比 非 集中 式 方法 容易 。 在 集中 式 方法 中 ， 所 有 状态 信 
息 都 集中 存放 在 一 处 ， 所 以 如 车 杀 死 了 数据 库 进程 ， 那 么 只 需 在 该 处 查看 以 识别 出 需要 解决 的 
未 完成 事务 ， 然 后 将 数据 库 恢复 到 一 致 状态 。 

图 20-3 描 绘 了 非 集中 式 方 法 ， 本 章 的 实现 就 是 采用 这 种 方法 。 
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用 户 进程 用 户 进程 用 户 进程 
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WE 


图 20-2 集中 式 数据 库 访问 


用 户 进程 用 户 进程 








图 20-3 非 集中 式 数 据 库 访问 


716 
调用 数据 库 库 函 数 执 行 WO 操 作 的 用 户 进 程 是 合作 进程 ， 它 们 使 用 字 节 范围 锁 机 制 来 实现 并 
发 访问 控制 。 
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20.6 并 发 


由 于 很 多 系统 的 实现 都 采用 两 个 文件 (一 个 索引 文件 和 一 个 数据 文件 ) 的 方式 ， 所 以 这 里 
也 特地 使 用 这 种 实现 方法 ， 这 要 求 能 够 控制 对 两 个 文件 的 加 锁 。 有 很 多 方法 可 用 来 对 两 个 文件 
进行 加 锁 。 

1. 粗 锁 

最 简单 的 加 锁 方法 是 将 这 两 个 文件 中 的 一 个 作为 整个 数据 库 的 锁 ， 并 要 求 调 用 者 在 对 数据 
库 进行 操作 前 必须 获得 这 个 锁 ， 这 种 加 锁 方式 称 为 粗 锁 (coarse-grained locking)。 例 如 ， 可 以 
认为 一 个 进程 对 索引 文件 的 0 字 节 加 了 读 锁 后 ， 就 能 读 整 个 数据 库 ， 一 个 进程 对 索引 文件 的 0 字 
节 加 了 写 锁 后 ， 就 能 写 整个 数据 库 。 可 以 使 用 UNIX 系 统 的 字 节 范围 锁 机 制 来 控制 每 次 可 以 有 
多 个 读 进程 ， 而 只 能 有 一 个 写 进程 ( 见 表 14-2)。db_fetch 和 db_nextrec 函 数 将 要 求 具有 读 
锁 , fido delete, db store[AJ&db openll|E€K RAE 586, (db open Sk S BABIES ER S 
如 果 要 创建 新 文件 的 话 ， 要 在 索引 文件 前 端 建立 空 的 空闲 链表 以 及 散 列 链表 。) 

粗 锁 的 问题 是 它 限制 了 最 大 程度 的 并 发 。 用 粗 锁 时 ， 当 一 个 进程 向 一 条 散 列 链 中 加 入 一 条 
记录 时 ， 其 他 进程 无 法 访问 另 一 条 散 列 链 上 的 记录 。 

2. AG 

下 面 用 称 为 细 锁 (fine-grained locking) 的 方法 来 改进 粗 锁 以 提高 并 发 度 。 首 先 ， 要 求 一 个 
读 进 程 或 写 进 程 在 操作 一 条 记录 前 必须 先 获 得 此 记录 所 在 散 列 链 的 读 锁 或 写 锁 ， 允 许 对 同一 条 
散 列 链 同时 可 以 有 多 个 读 进程 ， 而 只 能 有 一 个 写 进程 。 其 次 ， 一 个 写 进程 在 操作 空闲 链表 (如 
db_deletemdb_store) 前 ， 必 须 获 得 空闲 链表 的 写 锁 。 最 后 ， 当 db_store 向 索引 文件 或 
数据 文件 未 尾 追 加 一 条 新 记录 时 ， 必 须 获 得 对 应 文件 相应 区 域 的 写 锁 。 

期 望 细 锁 能 比 粗 锁 提 供 更 高 的 并 发 度 ，20.9 节 将 给 出 一 些 实际 的 比较 测试 结果 。20.8 节 给 
出 了 采用 细 锁 实现 的 源 代 码 ， 并 详细 讨论 了 锁 的 实现 ( 粗 锁 是 实现 的 简化 )。 

TER feum, HRA Tread, readv, writeffwritev, 而 没有 使 用 标准 WO 函数 库 。 
虽然 使 用 标准 IO 函数 库 也 可 以 使 用 字 节 范围 锁 ， 但 是 需要 非常 复杂 的 缓冲 管理 。 例 如 ， 当 另 一 
个 进程 在 5 分 钟 之 前 修改 了 数据 ， 不 希望 fgets 返 回 10 分 钟 前 读 和 人 标准 IO 缓冲 的 数据 。 

这 里 对 并 发 进行 讨论 ， 所 依据 的 是 对 数据 库 函 数 库 的 简单 需求 ， 商 业 系统 一 般 有 更 多 的 需 
要 。 关 于 并 发 更 多 的 细节 可 以 参见 Date[2004] 的 第 16 章 。 


20.7 构造 函数 库 


数据 库 的 函数 库 由 两 个 文件 构成 ， 它 们 是 : 公用 的 C 头 文件 以 及 一 个 C 源 文件 。 可 以 用 下 列 
命令 构造 一 静态 函数 库 。 


gcc -I../include -Wall -c db.c 
ar rsv libapue db.a db.o 


因为 在 数据 库 函 数 库 中 使 用 了 一 些 我 们 自己 的 公共 函数 ， 所 以 希望 与 1ibapue_db.a 相 链 
接 的 应 用 程序 也 需要 与 1ibapue .a 相 链接 。 
另 一 方面 ， 如 果 想 构建 数据 库 函 数 库 的 动态 共享 库 版 本 ， 那 么 可 使 用 下 列 命令 : 


gcc -I../include -Wall -fPIC -c db.c 
gcc -shared -Wl,-soname,libapue db.so.1 -o libapue db.so.1 V 
-L../lib -lapue -lc db.o 
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构建 成 的 共享 库 1ibapue_gdb .so.1 需 放置 在 动态 链接 / 装 入 程序 (dynamic linker/loader) 
能 够 找到 的 公用 目录 中 。 另 一 个 赫 代 的 方法 是 ; 将 共享 库 放 置 在 私有 目录 中 ， 修 改 
LD_LIBRARY_PATH 环 境 变量 ， 使 动态 链接 / 装 入 程序 的 搜索 路 径 包 含 该 私有 目录 。 


在 不 同 平台 上 构建 共享 库 的 步骤 会 有 所 不 同 ， 这 里 所 给 出 的 步骤 是 在 带 GNU CAE B Linux A 
统 中 进行 的 。 


20.8 源 代码 


本 节 对 所 编写 的 数据 库 函 数 库 源 代码 进行 解说 ， 先 从 头 文件 apue_db .h 开 始 。 函 数 库 源 
代码 以 及 调用 此 函数 库 的 所 有 应 用 程序 都 包含 这 一 头 文件 。 

从 此 处 开始 ， 实 例 程序 的 编排 方式 在 很 多 方面 与 前 面 的 有 所 不 同 。 首 先 ， 因 为 源 代码 较 长 ， 
为 此 加 了 行 号 ， 这 使 得 联系 相应 的 源 代码 进行 讨论 更 加 方便 。 其 次 ， 对 源 代码 的 说 明 紧 随 其 后 。 

这 种 风格 受到 John Lions 对 UNIX V6 浙 代码 注释 一 书 [Lions 1977，1996] 的 影响 ， 使 得 解释 说 明 大 
量 源 代码 更 为 简易 。 

注意 ， 这 里 对 空白 行 不 编号 。 虽 然 某 些 工具 (例如 pr(1)) 的 正常 操作 与 这 些 空白 行 是 有 
关 的 ， 但 是 此 处 对 它们 并 无 任何 兴趣 。 


1 #ifndef APUE DB H 
2 #define APUE DB H 


3 typedef void * DBHANDLE; 


4 DBHANDLE db open(const char *, int, ...); 

5 void db close (DBHANDLE) ; 

6 char *db fetch(DBHANDLE, const char *); 

7 int db store(DBHANDLE, const char *, const char *, int); 
8 int db delete(DBHANDLE, const char *); 

9 void db rewind (DBHANDLE) ; 

10 char *db nextrec(DBHANDLE, char *); 

11 /* 

12 * Flags for db store(). 

13 */ 

14 #define DB INSERT al /* insert new record only */ 

15 #define DB REPLACE 2 /* replace existing record */ 

16 #define DB STORE 3 /* replace or insert */ 

17 /* 

18 * Implementation limits. 
19 */ 
20 #define IDXLEN MIN 6 /* key, sep, start, sep, length, Mn */ 
21 #define IDXLEN MAX 1024 /* arbitrary */ 
22 #define DATLEN MIN 2 /* data byte, newline */ 
23 #define DATLEN MAX 1024 /* arbitrary */ 


24 #endif /* _APUE DB H */ 





[1-3] 使 用 符号 _APUE_DB_H 以 保证 只 包含 该 头 文件 一 次 。DBHANDLE 类 型 表示 对 数 
据 库 的 一 个 有 效 引 用 ， 用 于 隔离 应 用 程序 和 数据 库 的 实现 细节 。 数 据 库 函 数 库 
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向 应 用 程序 提供 DBHANDLE 类 型 ， 而 标准 1O 库 则 向 应 用 程序 提供 FILE 结 构 ， 两 
者 相 比 非常 相似 。 

[4-10] 接着 ， 声 明了 数据 库 函 数 库 公 用 函数 的 原型 。 因 为 使 用 函数 库 的 应 用 程序 包含 
了 此 文件 ， 所 以 这 里 不 再 声明 函数 库 私 有 函数 的 原型 。 

[11-24] ”定义 了 可 以 传送 给 ab_store 函 数 的 合法 标志 ， 其 后 是 实现 的 基本 限制 。 为 支 
持 更 大 的 数据 库 可 以 更 改 这 些 限制 。 
最 小 索引 记录 长 度 由 IDXLEN_MIN 指 定 。 这 表示 1 字 节 键 、1 字 节 分 隔 符 、1 字 节 
起 始 偏 移 量 、 另 一 个 1 字 节 分 隔 符 、1 字 节 长 度 和 终止 换行 符 。( 回 忆 图 20-1 中 索 
引 记录 的 格式 。) 一 条 索引 记录 通常 长 于 IDXLEN_MIN 字 节 ， 这 只 是 最 小 长 度 。 

下 一 个 文件 是 sb.c， 它 是 库 函 数 的 C 源 文件 。 为 简化 起 见 ， 将 所 有 函数 都 放 在 一 个 文件 中 。 

这 样 处 理 的 优点 是 只 要 将 私有 函数 声明 为 static， 就 可 对 外 将 它 隐 项 起 来 。 





1 #include "apue.h" 

2 #include "apue_db.h" 

3 #include «fcntl.h» /* open & db_open flags */ 
4 #include <stdarg.h> 

5 #include <errno.h> 

6 #include <sys/uio.h> /* struct iovec */ 


7 /* 


8 * Internal index file constants. 
9 * These are used to construct records in the 
10 * index file and data file. 
11 */ 
12 #define IDXLEN SZ 4 /* index record length (ASCII chars) */ 
13 #define SEP Dist /* separator char in index record */ 
14 Hdefine SPACE EUR /* space character */ 
15 #define NEWLINE ‘\n’ /* newline character */ 
16 /* 
17 * The following definitions are for hash chains and free 
18 * list chain in the index file. 
is */ 
20 #define PTR SZ 6 /* size of ptr field in hash chain */ 


21 #define PTR_MAX 999999 /* max file offset = l0**PTR SZ - 1 */ 
22 #define NHASH DEF 137 /* default hash table size */ 

23 #define FREE OFF 0 /* free list offset in index file */ 
24 #define HASH OFF PTR SZ /* hash table offset in index file */ 


25 typedef unsigned long  DBHASH; /* hash values */ 
26 typedef unsigned long COUNT; /* unsigned counter */ 
Iu DS M "acc cr «EE 


[1-6] 由 于 使 用 了 一 些 私 有 函数 库 中 的 函数 ， 所 以 程序 中 包含 了 apue.h。 当 然 ， 
apue .hh 也 包含 若干 标准 头 文件 ， 包括 <stdaio.h> 和 <unistda.h>。 因 为 
db_open 函 数 使 用 由 <staarg .h> 定 义 的 可 变 参 数 函数 ， 所 以 程序 中 也 包含 了 
<stdarg.h>, 

[7-26] 索引 记录 的 长 度 指定 为 IDXLEN_SZ。 用 某 些 字符 (例如 冒号 、 换 行 符 ) 作为 数 
据 库 中 的 分 隔 符 。 当 删除 一 条 记录 时 ， 在 其 中 全 部 填 人 空格 符 。 

其 中 一 些 定义 为 常量 的 值 也 可 定义 为 变量 ， 只 是 这 样 会 使 实现 复杂 一 些 。 例 如 ， 
设 定 散 列表 的 大 小 为 137 记 录 项 ， 也 许 更 好 的 方法 是 让 ab_open 的 调用 者 根据 预 
期 的 数据 库 大 小 通过 参数 来 设 定 这 个 值 ， 然 后 将 该 值 存储 在 索引 文件 的 最 前 面 。 
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27 /* 

28 * Library's private representation of the database. 

29 */ 

30 typedef struct { 

31 int idxfd; /* fd for index file */ 

32 int datfd; /* fd for data file */ 

33 char *idxbuf; /* malloc'ed buffer for index record */ 

34 char *datbuf; /* malloc'ed buffer for data record*/ 

35 char *name; /* name db was opened under */ 

36 off t idxoff; /* offset in index file of index record */ 

37 /* key is at (idxoff + PTR SZ + IDXLEN SZ) */ 

38 size t idxlen; /* length of index record */ 

39 /* excludes IDXLEN SZ bytes at front of record */ 

40 /* includes newline at end of index record */ 

41 off t datoff; /* offset in data file of data record */ 

42 Size t datlen; /* length of data record */ 

43 /* includes newline at end */ 

44 off t ptrval; /* contents of chain ptr in index record */ 

45 off t ptroff; /* chain ptr offset pointing to this idx record */ 

46 off t chainoff; /* offset of hash chain for this index record */ 

47 off t hashoff; /* offset in index file of hash table SL. 

48 DBHASH nhash; /* current hash table size */ 

49 COUNT cnt delok; /* delete OK */ 

50 COUNT cnt delerr; /* delete error */ 

51 COUNT cnt fetchok; /* fetch OK */ 

52 COUNT cnt fetcherr; /* fetch error */ 

53 COUNT cnt nextrec; /* nextrec */ 

54 COUNT cnt storl; /* store: DB INSERT, no empty, appended */ 

55 COUNT cnt stor2; /* store: DB INSERT, found empty, reused */ 

56 COUNT cnt stor3; /* store: DB REPLACE, diff len, appended */ 

57 COUNT cnt stor4; /* store: DB REPLACE, same len, overwrote */ 

58 COUNT cnt storerr; /* store error */ 

59  ) DB; 

[27-48] ”在 DB 结构 中 记录 一 个 打开 数据 库 的 所 有 信息 。db_open 函 数 返回 DB 结构 的 指针 
DBHANDLE 值 ， 这 个 指针 被 用 于 其 他 所 有 函数 ， 而 该 结构 本 身 则 不 面向 调用 者 。 
因为 在 数据 库 中 是 以 ASCI 码 形式 存放 指针 和 长 度 ， 所 以 要 将 这 些 ASCII 码 变换 
为 数字 值 ， 然后 存放 在 DB 结构 中 。DB 结 构 中 也 存放 散 列表 长 度 ， 虽 然 一 般 而 言 ， 
这 是 定 长 的 ， 但 也 有 可 能 为 增强 该 函数 库 ， 人 允许 调用 者 在 创建 数据 库 时 指定 该 
长 度 (见习 题 20.7) 。 

[49-59] ”DB 结构 的 最 后 10 个 字段 对 成 功 和 不 成 功 的 操作 计数 。 如 果 想 要 分 析 数 据 库 的 性 
能 ， 则 可 编写 一 个 函数 返回 这 些 统计 值 。 但 目前 仅 保持 这 些 计数 器 ， 并 未 编写 
此 种 函数 。 

60  /* 

61 * Internal functions. 

62 */ 

63 static DB * db alloc(int); 

64 static void db dodelete(DB *); 

65 static int .db find and lock (DB *, const char *, int); 

66 static int .db findfree(DB *, int, int); 

67 static void .db free(DB *); 

68 static DBHASH db hash(DB *, const char *); 

69 static char * db readdat(DB *); 

70 static off t db readidx(DB *, off t); 
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X20* 数据 库 函 数 库 


static off t db readptr(DB *, off t); 


Static void .db writedat(DB *, const char *, off t, int); 
static void .db writeidx(DB *, const char *, off t, int, off t); 
static void _db writeptr(DB *, off t, off t); 
/* 
* Open or create a database. Same arguments as open(2). 
*/ 
DBHANDLE 
db_open (const char *pathname, int oflag, ...) 
DB *db; 
int len, mode; 
size t i; 
char asciiptr[PTR SZ + 1], 


hash[(NHASH DEF + 1) * PTR SZ + 2]; 
/* «2 for newline and null */ 
struct stat statbuff; 


/* 
* Allocate a DB structure, and the buffers it needs. 
*/ 
len = strlen (pathname); 
if ((db = db alloc(len)) == NULL) 
err dump("db open: db alloc error for DB"); 


[60-74] — 选择 用 ab_ 开 头 来 命名 所 有 用 户 可 调用 (公用) 的 库 函 数 ， 用 _Sb_ 开 头 来 命名 内 部 


(私有 ) 函数 。 公 用 函数 在 函数 库 头 文件 apue_db.h 中 声明 。 内 部 函数 声明 为 
static， 所 以 只 有 同一 文件 中 的 其 他 函数 才能 调用 它们 (该 文件 包含 函数 库 实 现 )。 


[75-93] ”Gb_open 函 数 的 参数 与 open(2) 相 同 。 如 果 调 用 者 想 要 创建 数据 库 文 件 ， 那 么 


94 
95 
96 
97 


98 
99 


100 
101 
102 


103 
104 
105 
106 
107 
108 
109 
110 
111 
112 
113 


用 可 选择 的 第 三 个 参数 指定 文件 权限 。db_cpen 函 数 打开 索引 文件 和 数据 文件 ， 
在 必要 时 初始 化 索引 文件 。 该 函数 调用 _ab_alloc 来 为 DB 结构 分 配 空 间 ， 并 
初始 化 此 结构 。 


db-»nhash NHASH DEF;/* hash table size */ 

db-»hashoff - HASH OFF; /* offset in index file of hash table */ 
strcpy (db->name, pathname) ; 

strcat(db-»name, ".idx"); 


if (oflag & O CREAT) { 
va list ap; 


va start(ap, oflag); 
mode = va argí(ap, int); 


va end(ap); 

/* 

* Open index file and data file. 

*/ 

db->idxfd = open(db-»name, oflag, mode); 
strcpy (db->name + len, ".dat"); 
db->datfd = open(db-»name, oflag, mode); 

) eise { 

/* 

* Open index file and data file. 

*/ 


db->idxfd = open(db-»name, oflag); 
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[94-97] 


[98-108] 


[109-116] 


[117-120] 


121 
122 
123 
124 
125 
126 
127 
128 


129 
130 


131 
132 
133 
134 
135 
136 
137 


[121-130] 


[131-137] 


20.8 源 代码 579 


strcpy(db-»name + len, ".dat"); 
db-»datfd = open(db-»name, oflag); 


) 


if (db->idxfd « 0 || db-»datfd « 0) { 
.db free (db); 
return (NULL) ; 


} 


继续 初始 化 DB 结构 。 调 用 者 传 信 的 路 径 名 指定 数据 库 文 件 名 的 前 级 。 添 加 后 
组 . idx 以 构成 数据 库 索 引文 件 的 名 字 。 

如 果 调 用 者 想 要 创建 数据 库 文件 ， 那 么 使 用 <staarg .h> 中 的 可 变 参 数 函数 以 
找到 可 选 的 第 3 个 参数 ， 然 后 ， 使 用 open 来 创建 和 打开 索引 文件 和 数据 库 文件 。 
注意 ， 数 据 文件 的 文件 名 与 索引 文件 以 同样 的 前 级 开始 ， 只 是 后 绎 为 .dat。 

如 果 调 用 者 没有 指定 0_CREAT 标 志 ， 那 么 正在 打开 现 有 的 数据 库 文件 。 此 时 ， 
只 用 两 个 参数 调用 open。 

如 果 在 打开 或 创建 任 一 数据 库 文件 时 出 错 ， 则 调用 _db_free 清 除 DB 结构 ， 然 
后 对 调用 者 返回 NULL。 如 果 一 个 文件 open 成 功 ， 另 一 个 失败 ，_Gb_free 将 


关闭 该 打开 的 文件 描述 符 。 很 快 就 会 见 到 这 一 操作 。 
if ((oflag & (O CREAT | O TRUNC)) == (O CREAT | O TRUNC)) { 
/* 


* If the database was created, we have to initialize 
* it. Write lock the entire file so that we can stat 
* it, check its size, and initialize it, atomically. 
*/ 
if (writew lock(db-»idxfd, 0, SEEK SET, 0) < 0) 
err dump("db open: writew lock error"); 


if (fstat(db-»idxfd, &statbuff) « 0) 
err sys("db open: fstat error"); 


hh 


if (statbuff.st size == 0) { 

/* 
* We have to build a list of (NHASH DEF * 1) chain 
* ptrs with a value of 0. The +1 is for the free 
* list pointer that precedes the hash table. 
*/ 

sprintf(asciiptr, "%*d", PTR SZ, 0); 


如 果 正 在 建立 数据 库 ， 则 必须 正确 地 加 锁 。 考 虑 两 个 进程 试图 同时 建立 同一 个 
数据 库 的 情况 。 假 设 第 一 个 进程 运行 到 调用 fstat， 并 且 在 fstat 返 回 后 被 内 
核 阻 塞 。 这 时 第 二 个 进程 调用 ab_open， 发 现 索 引文 件 的 长 度 为 0， 于 是 初始 
化 空闲 链表 和 和 散 列 链表 ， 接 着 第 二 个 进程 向 数据 库 中 添加 了 一 条 记录 。 此 时 第 
二 个 进程 被 阻塞 ， 第 一 个 进程 继续 运行 ， 它 发 现 索 引文 件 的 长 度 为 0 (因为 第 一 
个 进程 调用 fstat 在 前 ， 然 后 第 二 个 进程 再 初始 化 索引 文件 ) ， 所 以 第 一 个 进程 
重新 初始 化 空闲 链表 和 散 列 链 表 ， 第 二 个 进程 写 人 的 记录 就 被 抹 去 了 。 避 免 发 
生 这 种 情况 的 方法 是 进行 加 锁 ， 为 此 可 以 使 用 14.3 节 中 的 readw_lock， 
writew_lock 和 un_lock 这 三 个 宏 。 

如 果 索 引文 件 的 长 度 是 0， 那 么 该 文件 是 刚刚 被 创建 的 ， 所 以 需要 初始 化 它 所 包 
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含 的 空闲 链表 和 散 列 链表 指针 。 注 意 ， 用 格式 字符 串 %*a 将 数据 库 指 针 从 整 型 
变换 为 ASCI 字 符 串 。( 在 _dab_writeidx 和 _dqb_writeptr 中 还 将 使 用 这 种 
格式 字符 串 。) 这 一 格式 告诉 sprintf 取 PTR_Sz 参 数 ， 用 它 作为 下 一 个 参数 的 
最 小 字段 宽度 ， 在 此 处 为 0( 因 为 正在 创建 一 个 新 的 数据 库 ， 所 以 这 里 使 指针 取 
初 值 为 0) 。 其 作用 是 强迫 创建 的 字符 串 至 少 包 含 PTR_Sz 个 字符 (在 左边 用 空 
格 填充 )。 在 _dqb_writeidx 和 _db_writeptr 中 ， 将 传送 一 个 非 0 指针 值 ， 但 
是 首先 将 验证 指针 值 不 大 于 PTR_MRAX， 以 保证 写 和 数据库 的 指针 字符 串 恰好 为 


PTR_S2Z(6) 个 字符 。 





138 hash[0] = 0; 

139 for (i = 0; i« NHASH DEF + 1; i++) 

140 strcat (hash, asciiptr); 

141 strcat(hash, "\n"); 

142 i = strlen(hash); 

143 if (write (db->idxfd, hash, i) != i) 

144 err dump("db open: index file init write error"); 
145 } 

146 if (un_lock(db->idxfd, 0, SEEK_SET, 0) < 0) 

147 err_dump ("db open: un lock error"); 

148 

149 db rewind (db); 

150 return(db); 

151 

152 /* 

153 * Allocate & initialize a DB structure and its buffers. 
154 */ 

155 Static DB * 

156 . db alloc(int namelen) 

157 

158 DB *db; 

159 /* 

160 * Use calloc, to initialize the structure to zero. 
161 */ 

162 if ((db = calloc(1, sizeof (DB))) == NULL) 

163 err dump(" db alloc: calloc error for DB"); 

164 db-»idxfd = db-»datfd = -1; /* descriptors */ 
165 /* 

166 * Allocate room for the name. 

167 * «5 for ".idx" or ".dat" plus null at end. 

168 */ 

169 if ((db->name = malloc(namelen + 5)) == NULL) 

170 err dump(" db alloc: malloc error for name"); 


[138-151] 继续 初始 化 新 创建 的 数据 库 。 构 造 散 列 表 ， 将 它 写 到 索引 文件 中 。 然 后 ， 解 锁 
索引 文件 ， 清 除数 据 库 文件 指针 ， 返 回 DB 结 构 指 针 作 为 句柄 ， 以 便 调 用 者 以 后 
用 于 其 他 数据 库 函 数 。 

[152-164] db_open 调 用 函数 _db_al1oc 为 DB 结构 分 配 空间 ， 包 括 一 个 索引 缓冲 和 一 个 
数据 缓冲 。 用 calloc 分 配 存储 区 ， 用 以 保存 DB 结构 ， 并 将 该 区 各 单元 全 部 置 
初 值 为 0。 这 产生 了 一 个 副作用 ， 就 是 将 数据 库 文件 描述 符 也 设置 为 0， 因 此 需 
将 它们 重新 设置 为 -1， 以 表示 它们 至 此 还 不 是 有 效 的 。 

[165-170] 分 配 空间 以 存放 数据 库 文件 的 名 字 。 如 db_open 中 所 说 明 的 那样 ， 使 用 缓冲 区 
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创建 文件 名 ， 通 过 更 改名 字 的 后 缀 表示 是 索引 文件 还 是 数据 文件 。 726 
171 /* 
172 * Allocate an index buffer and a data buffer. 
173 * +2 for newline and null at end. 
174 */ 
175 if ((db-»idxbuf = malloc(IDXLEN MAX + 2)) == NULL) 
176 err dump(" db alloc: malloc error for index buffer"); 
177 if ((db->datbuf = malloc(DATLEN MAX + 2)) == NULL) 
178 err dump(" db alloc: malloc error for data buffer"); 
179 return (db); 
180 
181 /* 
182 * Relinquish access to the database. 
183 */ 
184 void 
185 db close(DBHANDLE h) 
186 
187 .db free((DB *)h); /* closes fds, free buffers & struct */ 
188 } 
189 /* 
190 * Free up a DB structure, and all the malloc'ed buffers it 
191 * may point to. Also close the file descriptors if still open. 
192 */ 


193 Static void 
194 .db free(DB *db) 
195 


196 if (db-»idxfd >= 0) 
197 close (db-»idxfd); 
198 if (db-»datfd >= 0) 
199 close (db- >dat fd) ; 


[171-180] 为 索引 文件 和 数据 文件 的 缓冲 分 配 空间 。 索 引 缓冲 和 数据 缓冲 的 大 小 在 





apue_db.h 中 定义 。 数据库 函数 库 可 以 通过 让 这 些 缓冲 按 需 要 扩张 来 得 到 增强 ， 
其 方法 可 以 是 记录 这 两 个 缓冲 的 大 小 ,然后 在 需要 更 大 的 缓冲 时 调用 realloc。 
最 后 ， 返 回 已 分 配 到 的 DB 结构 的 指针 。 

[181-188] qb_close 函 数 只 是 一 个 包装 ， 它 将 数据 库 句柄 转换 为 DB 结构 的 指针 ， 将 其 传 
送 给 _db_free 函 数 ， 由 该 函数 释放 资源 以 及 DB 结构 。 

[189-199] ab_open 在 打开 索引 文件 和 数据 文件 时 如 果 发 生 错误 ， 则 调用 _db_free 释 放 
资源 ， 应 用 程序 在 结束 对 数据 库 的 使 用 后 ，db_close 也 调用 _db_free。 如 
果 数 据 库 索引 文件 的 文件 描述 符 有 效 ， 那 么 关闭 该 文件 ， 对 数据 文件 的 文件 措 
述 符 也 作 同 样 处 理 。( 回 忆 当 在 _ab_alloc 中 分 配 一 新 的 DB 结构 时 ， 对 每 个 文 
件 描述 符 都 赋 初 值 -1。 如 果 不 能 打开 两 个 数据 库 文件 中 的 一 个 ， 由 于 相应 的 文 


件 描述 符 仍 为 -1， 于 是 也 就 无 需 关 闭 它 。) 727 
200 if (db->idxbuf != NULL) 
201 free (db->idxbuf) ; 
202 if (db->datbuf != NULL) 
203 free (db->datbuf) ; 
204 if (db->name != NULL) 
205 free (db- >name) ; 
206 free (db) ; 


207 } 
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208 /* 
209 * Fetch a record. Return a pointer to the null-terminated data. 
210 */ 


211 char * 
212 db fetch(DBHANDLE h, const char *key) 


213 { 

214 DB *db = h; 

215 char *ptr; 

216 if ( db find and lock(db, key, 0) < 0) { 

217 ptr - NULL; /* error, record not found */ 
218 db->cnt_fetcherr++; 

219 } else { 

220 ptr = db readdat(db); /* return pointer to data */ 
221 db->cnt_fetchok++; 

222 } 

223 /* 

224 * Unlock the hash chain that db find and lock locked. 
225 */ 

226 if (un_lock(db->idxfd, db->chainoff, SEEK SET, 1) < 0) 
227 err dump("db fetch: un lock error"); 

228 return(ptr); 

229 } 


[200-207] 接着 ， 释 放 动 态 分 配 的 缓冲 。 可 以 安全 地 将 一 个 空 指针 传送 给 free 函 数 ， 因 此 
也 就 无 需 事先 检查 每 个 缓冲 指针 的 值 ， 但 无 论 如 何 还 是 要 这 样 做 ， 因 为 只 释放 
已 分 配 的 对 象 被 认为 是 一 种 较 好 的 编程 风格 。( 并 非 所 有 释放 函数 都 像 Eree 那 
样 容忍 差错 。) 最 后 ， 释 放 DB 结 构 占 用 的 存储 区 。 

[208-218] 函数 db_fetch 根 据 给 定 的 键 来 读 取 一 条 记录 。 它 首先 调用 _db_find_angd_ 
lock 在 数据 库 中 查找 该 记录 。 若 不 能 找到 该 记录 ， 则 将 返回 值 (ptr) 设置 为 
NULL， 并 将 不 成 功 的 记录 搜索 计数 值 加 1。 因 为 从 _ab_finaq_and_lock 返 回 
时 ， 数 据 库 索引 文件 是 加 锁 的 ， 所 以 先 要 解锁 ， 然 后 再 返回 。 

[219-229] 如 果 找 到 了 记录 ， 调 用 _ab_reaqdat 读 相应 的 数据 记录 ， 并 将 成 功 的 记录 搜 
索 计数 值 加 1。 在 返回 前 ， 调 用 un_lLock 对 索引 文件 解锁 ， 然 后 ， 返 回 所 找到 
记录 的 指针 〈 如 果 没 有 找到 所 需 记 录 ， 则 返回 NULL ) 。 


230 /* 

231 * Find the specified record. Called by db_delete, db_fetch, 
232 * and db_store. Returns with the hash chain locked. 

233 */ 

234 static int 

235 . db find and lock (DB *db, const char *key, int writelock) 

236 

237 off t offset, nextoffset; 

238 /* 

239 * Calculate the hash value for this key, then calculate the 
240 * byte offset of corresponding chain ptr in hash table. 
241 * This is where our search starts. First we calculate the 
242 * offset in the hash table for this key. 

243 */ 

244 db->chainoff = (_db hash(db, key) * PTR_SZ) + db->hashoff; 
245 db->ptroff = db-»chainoff; 

246 /* 
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* We lock the hash chain here. The caller must unlock it 
* when done. Note we lock and unlock only the first byte. 
*/ 
if (writelock) { 
if (writew_lock(db->idxfd, db-»chainoff, SEEK SET, 1) < 0) 
err dump(" db find and lock: writew lock error"); 
} eise { 
if (readw lock(db-»idxfd, db->chainoff, SEEK SET, 1) < 0) 
err dump(" db find and lock: readw lock error"); 


} 

/* 

* Get the offset in the index file of first record 
* on the hash chain (can be 0). 

*/ 

offset = db readptr(db, db-»ptroff); 





[230-237] _ab_find_andq_lock 函 数 在 函数 库 内 部 用 于 按 给 定 的 键 查找 记录 。 在 搜索 记 


录 时 ， 如 果 想 在 索引 文件 上 加 一 把 写 锁 ， 则 将 wzitelock 参 数 设置 为 非 0 值 ; 
如 果 将 writelock 参 数 设 置 为 0%， 则 在 搜索 记录 时 ， 在 索引 文件 上 加 读 锁 。 


[238-256] 在 _db_find_anq_lock 中 准备 遍历 散 列 链 。 将 键 变换 为 散 列 值 ， 用 其 计算 在 


文件 中 相应 散 列 链 的 起 始 地址 〈chainoff)。 在 遍历 散 列 链 前 ， 等 待 获得 锁 。 
注意 ， 只 锁 该 散 列 链 开始 处 的 第 1 个 字 节 ， 这 种 方式 允许 多 个 进程 同时 搜索 不 同 
的 散 列 链 ， 因 此 增加 了 并 发 性 。 


[257-261] 调用 _ab_readptr 读 散 列 链 中 的 第 一 个 指针 。 如 果 该 函数 返回 9， 则 该 散 列 链 
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为 空 。 


while (offset != 0) { 
nextoffset = db readidx(db, offset); 
if (strcmp (db->idxbuf, key) == 0) 
break; /* found a match */ 
db->ptroff = offset; /* offset of this (unequal) record */ 
offset = nextoffset; /* next one to compare */ 


} 
/* 
* offset -- 0 on error (record not found). 
*/ 
return (offset == 0? -1 : 0); 


} 


/* 
* Calculate the hash value for a key. 
*/ 

static DBHASH 

_db_hash(DB *db, const char *key) 


DBHASH hval = 0; 
char Cc; 
int i; 
for (iz 1; (c = *key++) != 0; i++) 
hval += c * i; /* ascii char times its 1-based index */ 


return (hval % db->nhash) ; 


} 


[262-268] while 循 环 遍历 散 列 链 中 的 每 一 条 索引 记录 ， 并 比较 键 。 调 用 函数 _ab_ 
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/* 
* 
* 
* 


* 


st 


readidx 读 取 每 条 索引 记录 。 它 将 当前 记录 的 键 填 人 DB 结构 中 的 1dqxbuf 字 段 。 
如 果 _ab_readidx 返 回 0， 则 已 到 达 散 列 链 的 最 后 一 个 记录 项 。 

如 果 在 循环 后 ，offset 为 0， 那 么 已 到 达 散 列 链 末端 并 且 没 有 找到 匹配 键 ， 于 
是 返回 --1， 否 则 ， 找 到 了 匹配 记录 〈 用 break 语 句 退 出 了 循环 )， 那 么 就 返回 0 
表示 成 功 。 此 时 ，pPtroff 字 段 包 含 前 一 索引 记录 的 地 址 ，aatoff 包 含 数 据 记 
录 的 地 址 ，datlen 是 数据 记录 的 长 度 。 当 沿 着 散 列 链 进行 遍历 时 ， 必 须 始 终 
跟踪 当前 索引 记录 的 前 一 条 索引 记录 ， 其 中 有 一 个 指针 指向 当前 索引 记录 。 这 
一 点 在 删除 一 条 记录 时 很 有 用 ， 因 为 必须 修改 当前 索引 记录 的 前 一 条 记录 的 链 
表 指 针 以 删除 当前 记录 。 

_db_hash 根 据 给 定 的 键 计 算 散 列 值 。 它 将 键 中 的 每 一 个 ASCII 字 符 乘 以 这 个 字 
符 在 字符 串 中 以 1 开始 的 索引 号 ， 将 这 些 结果 加 起 来 ， 除 以 散 列表 记录 项 数 ， 将 
余数 作为 这 个 键 的 散 列 值 。 回 忆 散 列表 记录 项 数 是 137， 它 是 一 个 素数 ， 按 
Knuth [1998] ， 素 数 散 列 通常 提供 良好 的 分 布 特性 。 


Read a chain ptr field from anywhere in the index file: 
the free list pointer, a hash table chain ptr, or an 
index record chain ptr. 
/ 
atic off_t 


.db readptr(DB *db, off t offset) 


+ + +*+ 


* 


st 


char asciiptr[PTR SZ + 1]; 
if (lseek(db-»idxfd, offset, SEEK SET) == -1) 

err dump(" db readptr: lseek error to ptr field"); 
if (read(db->idxfd, asciiptr, PTR SZ) !- PTR SZ) 


err dump(" db readptr: read error of ptr field"); 
asciiptr[PTR SZ] = 0; /* null terminate */ 
return (atol (asciiptr)); 


Read the next index record. We start at the specified offset 
in the index file. We read the index record into db->idxbuf 
and replace the separators with null bytes. If all is OK we 
set db->datoff and db->datlen to the offset and length of the 
corresponding data record in the data file. 
/ 
atic off t 


.db readidx(DB *db, off t offset) 


ssize t i; 

char *ptrl, *ptr2; 

char asciiptr[PTR SZ + 1], asciilen[IDXLEN SZ + 1]; 
struct iovec iov[2]; 





[287-302] _Gb_readptr 函 数 读 取 以 下 三 种 不 同 链表 指针 中 的 任意 一 种 :(1) 索引 文件 最 


开始 处 指向 空闲 链表 中 第 一 条 索引 记录 的 指针 ，(2) 散 列表 中 指向 散 列 链 的 第 一 
条 索引 记录 的 指针 ，(3) 存放 在 每 条 索引 记录 开始 处 、 指 向 下 一 条 记录 的 指针 
(这 里 的 索引 记录 既 可 以 处 于 一 条 散 列 链 中 ， 也 可 以 处 于 空闲 链表 中 ) 。 返 回 前 ， 
将 指针 从 ASCII 形 式 变换 为 长 整 型 。 此 函数 不 进行 任何 加 锁 操 作 ， 所 以 其 调用 
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者 应 事先 做 好 必要 的 加 锁 。 


[303-316] _ab_zreadidx 函 数 用 于 从 索引 文件 的 指定 偏 移 量 处 读 取 索 引 记录 。 如 果 成 功 ， 


317 
318 
319 
320 
321 
322 
323 
324 


325 
326 
327 
328 
329 
330 
331 
332 
333 
334 
335 
336 
337 
338 


339 
340 
341 
342 
343 


344 
345 
346 
347 


该 函数 将 返回 链表 中 下 一 条 记录 的 偏 移 量 。 并 且 该 函数 填充 DB 结构 的 许多 字段 : 
idxoff 包 含 索引 文件 中 当前 记录 的 偏 移 量 ，ptrval 包 含 在 散 列 链表 中 下 一 条 
索引 项 的 偏 移 量 ，idxlen 包 含 当 前 索引 记录 的 长 度 ，idxbuf 包 含 实 际 索 引 记 
录 ，qdatoff 包 含 数据 文件 中 该 记录 的 偏 移 量 ，dat1len 包 含 该 数据 记录 的 长 度 。 


/* 

* Position index file and record the offset. db_nextrec 

* calls us with offset==0, meaning read from current offset. 
* We still need to call lseek to record the current offset. 
*/ 
if ((db->idxoff = lseek (db->idxfd, offset, 

offset == 0 ? SEEK_CUR : SEEK_SET)) =s -1) 

err_dump ("_db_readidx: lseek error"); 


/* 

* Read the ascii chain ptr and the ascii length at 
* the front of the index record. This tells us the 
* remaining size of the index record. 


*/ 


iov[0].iov base = asciiptr; 
iov[0].iov len = PTR SZ; 

iov[1].iov base - asciilen; 
iov[1].iov len = IDXLEN SZ; 


if ((i = readv(db-»idxfd, &iov[0], 2)) != PTR SZ + IDXLEN SZ) { 
if (i == 0 && offset == 0) 
return(-1); /* EOF for db nextrec */ 
err dump(" db readidx: readv error of index record"); 


) 


/* 
* This is our return value; always >= 0. 
*/ 
asciiptr[PTR SZ) - 0; /* null terminate */ 


db->ptrval = atol(asciiptr); /* offset of next key in chain */ 


asciilen[IDXLEN SZ] = 0; /* null terminate */ 
if ((db->idxlen = atoi(asciilen)) « IDXLEN MIN || 
db->idxlen > IDXLEN MAX) 
err dump(" db readidx: invalid length"); 


[317-324] 按 调用 者 提供 的 参数 ， 查 找 索引 文件 偏 移 量 。 在 DB 结构 中 ， 记 录 该 偏 移 量 ， 为 


此 即使 调用 者 想 要 在 当前 文件 偏 移 量 处 读 记录 (设置 offset 为 0) ， 仍 需要 调 
用 1seek 以 确定 当前 偏 移 量 。 因 为 在 索引 文件 中 ， 索 引 记录 决 不 会 存放 在 偏 移 
量 为 0 处 ， 所 以 可 以 放心 地 使 用 0 表示 “从 当前 偏 移 量 处 读 ”。 


[325-338] 调用 reaqv 读 在 索引 记录 开始 处 的 两 个 定 长 字段 : 指向 下 一 条 索引 记录 的 链表 


指针 和 该 索引 记录 余下 部 分 的 长 度 (余下 部 分 是 不 定 长 的 ) 。 


[339-347] 变换 下 一 记录 的 偏 移 量 为 整 型 ， 并 存放 到 ptrval 字 段 (这 将 作为 此 函数 的 返 


348 
349 
350 


回 值 ) 。 然 后 将 索引 记录 的 长 度 变换 为 整 型 ， 并 存放 在 iaxlen 字 段 。 
/* 


* Now read the actual index record. We read it into the key 
* buffer that we malloced when we opened the database. 


bbs.theithome.com 


~J 
U 
— 





~ 





586 X20* 数据 库 函 数 摩 








351 */ 

352 if ((i = read(db->idxfd, db->idxbuf, db->idxlen)) != db->idxlen) 

353 err dump(" db readidx: read error of index record"); 

354 if (db->idxbuf [db->idxlen-1] != NEWLINE) /* sanity check */ 

355 err dump(" db readidx: missing newline"); 

356 db->idxbuf [db-»idxlen-1] = 0; /* replace newline with null */ 

357 /* 

358 * Find the separators in the index record. 

359 */ 

360 if ((ptrl = strchr(db-»idxbuf, SEP)) == NULL) 

361 err dump(" db readidx: missing first separator"); 

362 *ptri++ = 0; /* replace SEP with null */ 

363 if ((ptr2 = strchr(ptrl, SEP)) == NULL) 

364 err dump(" db readidx: missing second separator"); 

365 *ptr2++ = 0; /* replace SEP with null */ 

366 if (strchr(ptr2, SEP) != NULL) 

367 err dump(" db readidx: too many separators") ; 

368 /* 

369 * Get the starting offset and length of the data record. 

370 */ 

371 if ((db-»datoff = atol(ptr1)) < 0) 

372 err dump(" db readidx: starting offset « 0"); 

373 if ((db-»datien = atol(ptr2)) <= 0 || db->datlen > DATLEN MAX) 

374 err dump(" db readidx: invalid length"); 

375 return (db->ptrval) ; /* return offset of next key in chain */ 

376 } 

[348-356] 将 索引 记录 的 不 定 长 部 分 读 人 DB 结构 中 的 idxbuf 字 段 。 该 记录 应 以 换行 符 结 
束 ， 将 该 字符 代 换 为 NULL 字 节 。 如 果 索 引文 件 已 遭 破 坏 ， 那 么 调用 err_dump 
函数 构造 core 文 件 后 终止 。 

[357-367] 将 索引 记录 划分 成 三 个 字段 : 键 、 对 应 数据 记录 的 偏 移 量 和 数据 记录 的 长 度 。 
strchr 函 数 在 给 定 字 符 串 中 找到 首次 出 现 的 指定 字符 。 这 里 要 寻找 的 是 记录 
中 分 隔 字段 的 字符 (SEP， 将 其 定义 为 冒号 ) 。 

[368-376] 将 数据 记录 的 偏 移 量 和 长 度 变换 为 整 型 ， 并 把 它们 存放 在 DB 结构 中 。 然 后 ， 返 
回 散 列 链 中 下 一 条 记录 的 偏 移 量 。 注 意 并 不 读数 据 记 录 ， 这 由 调用 者 自己 完成 。 
例如 ,在 db_fetch 中 ,在 _db_find_and_lock 按 键 找 到 索引 记录 前 是 不 读 
取 数 据 记 录 的 。 

377 /* 

378 * Read the current data record into the data buffer. 

379 * Return a pointer to the null-terminated data buffer. 

380 */ 


381 static char * 
382 _db readdat (DB *db) 


383 { 
384 
385 
386 
387. 
388 
389 
390 
391 


if . (1seek (db->datfd, db-»datoff, SEEK SET) == -1) 
err_dump("_db readdat: lseek error"); 
if (read(db->datfd, db->datbuf, db->datlen) != db->datlen) 


err dump(" db readdat: read error"); 
if (db-»datbuf[db-»datlen-1] != NEWLINE) /* sanity check */ 
err dump(" db readdat: missing newline"); 
db-»datbuf[db-»datlen-1] = 0; /* replace newline with null */ 
return (db->datbuf) ; /* return pointer to data record */ 
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} 
/* 
* Delete the specified record. 
*/ 
int 
db delete (DBHANDLE h, const char *key) 


{ 


DB *db = h; 
int re = 0; /* assume record will be found */ 
if (_db find_and_lock(db, key, 1) == 0) { 


.db dodelete (db); 
db->cnt_delok++; 
} else { 
re = -1; /* not found */ 
db->cnt_delerr++; 


if (un_lock(db->idxfd, db->chainoff, SEEK_SET, 1) < 0) 
err_dump("db delete: un_lock error"); 
return (re) ; 


} 





[377-392] 在 datoff 和 datlen 已 获 正确 值 后 ，_db_readdat 函 数 将 数据 记录 的 内 容 读 


[393-411] db_delete 函 数 用 于 删除 与 给 定 键 匹配 的 一 条 记录 。 调 用 _db_find_and_ 


412 
413 
414 
415 
416 
417 
418 
419 
420 
421 
422 


423 
424 
425 
426 
427 
428 
429 
430 
431 


432 
433 
434 


入 DB 结构 中 的 aatbuf 字 段 指向 的 缓冲 区 。 


1ock 判 断 在 数据 库 中 该 记录 是 否 存在 ， 如 果 存 在 ， 则 调用 _db_dodelete 函 
数 执行 删除 该 记录 的 操作 。_db_finad_anaq_lock 的 第 3 个 参数 控制 对 散 列 链 
是 加 读 锁 ， 还 是 写 锁 。 此 处 ， 因 为 可 能 执行 更 改 该 链表 的 操作 ， 所 以 要 加 一 把 
写 锁 。_dqb_find_and_1lock 返 回 时 ， 这 把 锁 仍 旧 存 在 ， 为 此 不 管 是 否 找到 了 





/* 


* Delete the current record specified by the DB structure. 
* This function is called by db delete and db store, after 
* the record has been located by db find and lock. 

*/ ` 


static void 


{ 


_db_dodelete (DB *db) 


int i; 

char *ptr; 

off_t freeptr, saveptr; 

/* 

* Set data buffer and key to all blanks. 
*/ 


for (ptr = db-»datbuf, i = 0; i < db-»datlen - 1; i++) 
*ptr++ = SPACE; 

*ptr = 0;  /* null terminate for db writedat */ 

ptr = db->idxbuf; 

while (*ptr) 
*ptr++ = SPACE; 


/* 
* We have to lock the free list. 


*/ 
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435 if (writew lock(db-»idxfd, FREE OFF, SEEK SET, 1) < 0) 
436 err dump(" db dodelete: writew lock error"); 

437 /* 

438 * Write the data record with all blanks. 

439 */ 

440 .db writedat (db, db->datbuf, db-»datoff, SEEK SET); 





[412-431] _db_daodelete 函 数 执行 从 数据 库 中 删除 一 条 记录 的 所 有 操作 。( 该 函数 也 可 
以 由 ab_store 调 用 )。 此 函数 的 大 部 分 工作 仅仅 是 更 新 两 个 链表 ， 空闲 链表 以 
及 与 键 对 应 的 散 列 链 。 当 一 条 记录 被 删除 后 ， 将 其 键 和 数据 记录 设 为 空 。 本 节 
后 面 将 提 到 的 函数 db_nextrec 要 用 到 这 一 点 。 

[432-440] 调用 writew_Lock 对 空闲 链表 加 写 锁 ， 这 样 能 防止 两 个 进程 同时 删除 不 同 散 
列 链 上 的 记录 时 产生 相互 影响 ， 因 为 要 将 被 删除 的 记录 移 到 空闲 链表 上 ， 这 将 
改变 空闲 链表 指针 ， 而 一 次 只 能 有 一 个 进程 能 这 样 做 。 
_db_qdodelete 调 用 函数 _db_writedat 清 空 数据 记录 ,注意 此 时 
_9b_writedat 无 需 对 数据 文件 加 写 锁 ， 因 为 dab_delete 对 这 条 记录 的 散 列 
链 已 经 加 了 写 锁 ， 这 便 保证 不 再 会 有 其 他 进程 能 够 读 写 该 记录 。 





441 /* 

442 * Read the free list pointer. Its value becomes the 

443 * chain ptr field of the deleted index record. This means 
444 * the deleted record becomes the head of the free list. 
445 */ 

446 freeptr = db readptr(db, FREE OFF); 

447 /* 

448 * Save the contents of index record chain ptr, 

449 * before it's rewritten by db writeidx. 

450 */ 

451 Saveptr = db-»ptrval; 

452 /* 

453 * Rewrite the index record. This also rewrites the length 
454 * of the index record, the data offset, and the data length, 
455 * none of which has changed, but that's OK. 

456 */ 

457 -db writeidx(db, db->idxbuf, db->idxoff, SEEK SET, freeptr) ; 
458 /* 

459 * Write the new free list pointer. 

460 */ 

461 _db_writeptr (db, FREE OFF, db->idxoff) ; 

462 /* 

463 * Rewrite the chain ptr that pointed to this record being 
464 * deleted. Recall that db find and lock sets db-»ptroff to 
465 * point to this chain ptr. We set this chain ptr to the 
466 * contents of the deleted record's chain ptr, Baveptr. 

467 x / 

468 .db writeptr(db, db->ptroff, saveptr); 

469 if (un lock (db-»idxfd, FREE OFF, SEEK SET, 1) « 0) 

470 err dump(" db dodelete: un lock error"); 

471  ) 


[441-461] 读 空 闲 链表 指针 ， 接 着 修改 素 引 记录 ， 让 这 条 记录 中 的 下 一 条 记录 指针 指向 空闲 


链表 的 第 一 条 记录 (如 果 空 闲 链表 为 空 ， 则 这 个 链表 指针 置 为 0)。 既 然 已 经 清除 
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了 键 ， 就 用 正 被 删除 的 素 引 记录 的 偏 移 量 更 新 空闲 链表 指针 ， 也 就 是 使 其 指向 当 

前 删除 的 这 条 记录 ， 这 样 就 将 这 条 删除 的 记录 加 到 了 空闲 链表 之 首 。 空 闲 链表 实 

际 上 很 像 一 个 后 进 先 出 的 堆栈 (虽然 是 以 首次 适应 算法 分 配 空闲 链表 项 ) 。 

没有 为 每 个 文件 分 别 设置 空闲 链表 。 当 把 一 个 删除 的 索引 记录 加 入 空闲 链表 时 ， 

该 索引 记录 仍 指向 已 删除 的 数据 记录 。 有 更 好 的 处 理 方 法 ， 但 复杂 性 增加 了 。 
[462-471] 修改 散 列 链 中 前 一 条 记录 的 指针 ， 使 其 指向 正 删除 记录 之 后 的 一 条 记录 ， 这 样 


便 从 散 列 链 中 撤除 了 要 删 去 的 记录 。 最 后 对 空闲 链表 解锁 。 736 
472 /* 
473 * Write a data record. Called by db dodelete (to write 
474 * the record with blanks) and db store. 
475 */ 
476 static void 
477 .db writedat (DB *db, const char *data, off t offset, int whence) 
478 
479 struct iovec iov[2] ; 
480 static char newline = NEWLINE; 
481 /* 
482 * If we're appending, we have to lock before doing the lseek 
483 * and write to make the two an atomic operation. If we're 
484 * overwriting an existing record, we don't have to lock. 
485 */ 
486 if (whence == SEEK_END) /* we're appending, lock entire file */ 
487 if (writew_lock(db->datfd, 0, SEEK SET, 0) < 0) 
488 err dump(" db writedat: writew lock error"); 
489 if ((db-»datoff = lseek(db->datfd, offset, whence)) == -1) 
490 err dump(" db writedat: lseek error"); 
491 db-»datlen = strlen(data) + 1; /* datlen includes newline */ 
492 iov[0].iov base = (char *) data; 
493 iov[0].iov len = db-»datlen - 1; 
494 iov[1].iov base = &newline; 
495 iov[1].iov len = 1; 
496 if (writev(db-»datfd, &iov[0], 2) != db-»datlen) 
497 err dump(" db writedat: writev error of data record"); 
498 if (whence -- SEEK END) 
499 if (un lock(db-»datfd, 0, SEEK SET, 0) « 0) 
500 err dump(" db writedat: un lock error"); 
501  ) 


[472-491] 调用 函数 _ab_writedat 写 一 个 数据 记录 。 当 删除 一 条 记录 时 ， 调 用 函数 
_db_writedat 清 空 数据 记录 ， 此 时 _db_writedat 并 不 对 数据 文件 加 写 锁 ， 
因为 ab_delete 对 该 记录 的 散 列 链 已 经 加 了 写 锁 ， 这 便 保证 不 再 会 有 其 他 进程 
能 够 读 写 这 条 记录 。 在 本 节 稍 后 处 解说 db_store 函 数 时 ,会 遇 到 
_Gb_writedat 沙 数 追 加 数据 文件 的 情况 ， 此 时 就 必须 对 该 文件 加 锁 。 
确定 要 写 数据 记录 的 位 置 。 要 写 的 字 节 数 是 记录 长 度 十 1 字 节 ， 这 1 个 字 节 是 为 
表示 记录 终止 的 换行 符 而 增加 的 。 

[492-501] 设置 ovec 数 组 ， 调 用 writev 写 数据 记录 和 换行 符 。 因 为 不 能 想当然 地 认为 调 
用 者 缓冲 区 的 尾 端 有 空间 可 以 加 换行 符 ， 所 以 先 将 换行 符 送 入 另 一 个 缓冲 ， 然 后 
再 从 该 缓冲 写 至 数据 记录 。 如 果 正 对 文件 添加 一 条 记录 ， 则 释放 早先 获得 的 锁 。 — U37 
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[502-524] iHHi db writeidxiEUE — 43:5. ERRINA h FTE ARE, 
创建 索引 记录 ， 并 将 它 的 后 半 部 分 存放 到 idxbuf 中 。 需 要 索引 记录 这 一 部 分 的 
长 度 以 创建 该 记录 的 前 半 部 分 ， 而 前 半 部 分 被 存放 到 局 部 变量 asciiptrlen 中 。 
注意 ， 基 于 off_t 数 据 类 型 的 长 度 ， 选 择 传送 给 sprintEf 的 格式 字符 串 。 即 使 
32 位 的 系统 也 能 提供 64 位 的 文件 偏 移 量 ， 所 以 不 能 假定 cff_t 数 据 类 型 的 长 度 。 
和 _dab_writedat 一 样 ， 只 有 在 向 索引 文件 添加 新 索引 记录 时 这 一 函数 才 需 要 
加 锁 。_db_dodelete 调 用 此 函数 是 为 了 重 写 一 条 现 有 的 索引 记录 ， 在 这 种 情 
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* 


502 


* Write an index record. | db writedat is called before 
* this function to set the datoff and datlen fields in the 
* DB structure, which we need to write the index record. 


*/ 


Static void 


{ 


db_writeidx(DB *db, const char *key, 
off_t offset, int whence, off_t ptrval) 


struct iovec ioví2]; 

char asciiptrlen[PTR SZ + IDXLEN SZ +1); 
int len; 

char *fmt; 


if ((db-»ptrval = ptrval) < 0 || ptrval > PTR MAX) 
err quit(" db writeidx: invalid ptr: %d", ptrval); 
if (sizeof(off t) == sizeof (long long)) 
fmt = "$g$c$lld&c$dWAn"; 
else 
fmt = "%stctldtctd\n"; 
sprintf (db->idxbuf, fmt, key, SEP, db-»datoff, SEP, db-»datlen); 
if ((len = strlen(db->idxbuf)) « IDXLEN MIN || len > IDXLEN MAX) 
err dump(" db. writeidx: invalid length"); 
Sprintf(asciiptrlen, "$*1d$*d", PTR SZ, ptrval, IDXLEN SZ, len); 


/* 
* If we're appending, we have to lock before doing the lseek 
* and write to make the two an atomic operation. If we're 

* overwriting an existing record, we don't have to lock. 

* 

/ 
if (whence == SEEK END) /* we're appending */ 

if (writew_lock(db->idxfd, ((db->nhash+1) *PTR_SZ)+1, 
SEEK SET, 0) « 0) 
err dump(" db writeidx: writew lock error"); 





况 下 调用 者 已 经 在 散 列 链 上 加 了 写 锁 ， 所 以 不 再 需要 加 另外 的 锁 。 





/* 

* Position the index file and record the offset. 

*/ 
if ((db->idxoff = lseek(db->idxfd, offset, whence)) == -1) 


err_dump("_db writeidx: lseek error"); 


iov[0].iov base - asciiptrlen; 


iov[0].iov len = PTR SZ + IDXLEN SZ; 

iov[1] .iov base = db->idxbuf; 

iov(il.iov len = len; 

if (writev(db->idxfd, &iov(0], 2) != PTR_SZ + IDXLEN SZ + len) 


err dump(" db writeidx: writev error of index record"); 
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if (whence == SEEK END) 
if (un_lock(db->idxfd, ((db->nhash+1) *PTR_SZ)+1, 
SEEK SET, 0) « 0) 
err dump(" db writeidx: un lock error"); 


) 
/* 


* Write a chain ptr field somewhere in the index file: 
* the free list, the hash table, or in an index record. 
t 

Static void 

.db writeptr(DB *db, off t offset, off t ptrval) 


char asciiptr[PTR_SZ + 1]; 


if (ptrval < O || ptrval > PTR MAX) 
err quit(" db writeptr: invalid ptr: $d", ptrval); 
sprintf(asciiptr, "$*ld", PTR SZ, ptrval); 


if (lseek(db->idxfd, offset, SEEK SET) == -1) 
err dump(" db writeptr: lseek error to ptr field"); 
if (write (db->idxfd, asciiptr, PTR SZ) != PTR SZ) 


err dump(" db writeptr: write error of ptr field"); 


) 


[534-549] 设置 索引 文件 偏 移 量 ， 从 此 处 开始 写 索 引 记录 ， 将 该 偏 移 量 存 人 DB 结构 的 


idxoff 字 段 。 因 为 是 在 两 个 分 开 的 缓冲 中 构造 索引 记录 ， 所 以 调用 writev 将 
它 存 放 到 索引 文件 中 。 如 果 是 追加 该 文件 ， 则 释放 在 定位 操作 前 加 的 锁 。 从 并 
发 运行 的 进程 添加 新 记录 至 同一 数据 库 角度 思考 问题 ， 那 么 这 把 锁 使 定位 
(seek) 和 写成 为 原子 操作 。 


[550-565] _db_writeptr 用 于 将 一 个 链表 指针 写 至 索引 文件 中 。 验 证 该 指针 在 索引 文件 
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585 
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587 


的 边界 范围 内 ， 然 后 将 它 变 换 成 ASCII[ 字 符 串 。 按 指定 的 偏 移 量 在 索引 文件 中 
定位 ， 接 着 将 该 指针 ASCI 字 符 串 写 人 索引 文件 。 





/* 
* Store a record in the database. Return 0 if OK, 1 if record 
* exists and DB INSERT specified, -1 on error. 
*/ 

int 

db store(DBHANDLE h, const char *key, const char *data, int flag) 


{ 
DB *db = h; 
int re, keylen, datlen; 
off t  ptrval; 


if (flag !- DB INSERT && flag != DB REPLACE && 
flag !- DB STORE) ( 
errno - EINVAL; 
return(-1); 
} 
keylen = strlen(key); 
datlen = strlen(data) + 1; /* +1 for newline at end */ 
if (datlen < DATLEN MIN || datlen > DATLEN MAX) 
err dump("db store: invalid data length"); 


/* 
* db find and lock calculates which hash table this new record 
* goes into (db-»chainoff), regardless of whether it already 
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* exists or not. The following calls to db writeptr change the 
* hash table entry for this chain to point to the new record. 
* The new record is added to the front of the hash chain. 
* 
/ 
if ( db find and lock(db, key, 1) « 0) { /* record not found */ 
if (flag == DB REPLACE) { 
rc = -1; 
db->cnt_storerr++; 
errno = ENOENT; /* error, record does not exist */ 
goto doreturn; 


} 





[566-584] db_store 函 数 用 于 将 一 条 记录 加 到 数据 库 中 。 首 先 验证 参数 flag 的 值 ， 然 后 ， 


查 明 数 据 记录 长 度 是 否 有 效 ， 如 果 无 效 ， 则 构造 core 文 件 并 退出 。 作 为 一 个 例 
子 这 样 处 理 无 可 厚 非 ， 但 如 果 构 造 的 是 可 正式 应 用 的 函数 库 ， 那 么 最 好 返回 出 
错 状态 而 非 退出 ， 这 样 可 以 给 应 用 程序 一 个 恢复 机 会 。 


[585-598] 调用 _db_find_and_lock 以 查看 这 个 记录 是 否 已 经 存在 。 如 果 记录 并 不 存在 
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且 指 定 的 标志 为 DB_INSERT 或 DB_STORE ， 或 者 记录 存在 且 指 定 的 标志 ; 
DB_REPLRACE 或 DBE_STORE， 和 那么 这 些 都 是 允许 的 。 替 换 一 条 已 存在 的 记录 ， 
指 的 是 该 记录 的 键 一 样 ， 而 数据 记录 很 可 能 不 一 样 。 注 意 ， 因 为 db_store 很 
可 能 会 修改 散 列 链 ， 所 以 用 _dlbb_find_and_lock 的 最 后 一 个 参数 指明 要 对 散 
列 链 加 写 锁 。 





/* 
* db find and lock locked the hash chain for us; read 
* the chain ptr to the first index record on hash chain. 
*/ 

ptrval = db readptr(db, db-»chainoff); 


if ( db findfree(db, keylen, datlen) « 0) { 
/* 
* Can't find an empty record big enough. Append the 
* new record to the ends of the index and data files. 
*/ 
.db writedat(db, data, 0, SEEK END); 
.db writeidx(db, key, 0, SEEK END, ptrval); 


/* 
* db->idxoff was set by db writeidx. The new 
* record goes to the front of the hash chain. 
Ef 
.db writeptr(db, db-»chainoff, db-»idxoff); 
db->cnt_storl++; 
} else { 
/* 
* Reuse an empty record. db findfree removed it from 
* the free list and set both db->datoff and db->idxoff. 
* Reused record goes to the front of the hash chain. 
*/ 
.db writedat(db, data, db-»datoff, SEEK SET); 
.db writeidx(db, key, db->idxoff, SEEK SET, ptrval); 
. db writeptr(db, db-»chainoff, db-»idxoff); 
db-»cnt stor24«; 
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在 调用 _ab_finaq_and_1lock 后 ， 程 序 分 成 四 种 情况 。 前 两 种 情况 中 ， 没 有 找 
到 相应 的 记录 ， 所 以 添加 新 记录 。 读 散 列 链 上 第 一 项 的 偏 移 量 。 
第 一 种 情况 : 调用 _ab_finqafree 在 空闲 链表 中 搜索 一 条 已 删除 的 记录 ， 它 的 
键 长 度 和 数据 长 度 与 参数 keylen 和 dat1len 相 同 。 如 果 没 有 找到 对 应 大 小 的 记 
录 。 这 意味 着 要 将 这 条 新 记录 添加 到 索引 文件 和 数据 文件 的 末尾 。 调 用 _db_ 
writedat 写 数据 部 分 ， 调用 _dab_writeidx 写 索引 部 分 ， 调 用 _db_writeptr 
将 新 记录 加 到 对 应 的 散 列 链 的 链 首 。 将 对 此 种 情况 的 执行 进行 计数 的 计数 器 
(cnt_stor1) 值 加 1， 以 便 观察 数据 库 的 运行 状况 。 
第 二 种 情况 ，_dlb_findfree 找 到 了 对 应 大 小 的 空 记录 ， 并 将 这 条 空 记录 从 空 
闲 链 表 上 移 下 来 (很 快 就 会 见 到 _db_findfree 的 实现 )， 写 人 新 的 索引 记录 
和 数据 记录 ， 然 后 ， 与 第 一 种 情况 一 样 ， 将 新 记录 加 到 对 应 的 散 列 链 的 链 首 。 
将 对 此 种 情况 的 执行 进行 计数 的 计数 器 (cnt_stor2) 值 加 1， 以 便 观察 数据 
库 的 运行 状况 。 
} else { /* record found */ 

if (flag == DB_INSERT) { 

re = 1; /* error, record already in db */ 


db->cnt_storerr++; 
goto doreturn; 


/* 

* We are replacing an existing record. We know the new 
* key equals the existing key, but we need to check if 
* the data records are the same size. 


*/ 

if (datlen != db-»datlen) { 
.db dodelete (db); /* delete the existing record */ 
/* 


* Reread the chain ptr in the hash table 
* (it may change with the deletion). 
* 


ptrval = db readptr(db, db-»chainoff); 
/* 


* Append new index and data records to end of files. 
*/ 

.db writedat(db, data, 0, SEEK END); 

.db writeidx(db, key, 0, SEEK END, ptrval); 


/* 
* New record goes to the front of the hash chain. 
*/ 
_db writeptr(db, db-»chainoff, db->idxoff) ; 
db->cnt_stor3++; 
} else { 


[628-633] 另 两 种 情况 是 具 相同 键 的 记录 在 数据 库 中 已 存在 。 如 果 不 想 替换 该 记录 ， 则 设 


置 表示 一 条 记录 已 经 存在 的 返回 码 ， 将 对 存储 出 错 计数 的 计数 器 (cnt_storerr) 
值 加 1， 然 后 跳 转 至 函数 末尾 ， 在 此 处 理 公共 返回 逻辑 。 


[634-656] 第 三 种 情况 : 要 替换 一 条 现存 记录 ， 而 新 数据 记录 的 长 度 与 已 存在 记录 的 长 度 


不 一 样 。 调 用 _dab_dodelete 将 老 记 录 删 除 ， 该 删除 记录 将 放 在 空闲 链表 的 链 
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首 。 然 后 ， 调 用 _db_writedat 和 _db_writeidx 将 新 记录 添加 到 索引 文件 和 
数据 文件 的 末尾 (也 可 以 用 其 他 方法 ， 如 可 以 再 找 一 找 是 否 有 数据 大 小 正好 的 
已 删除 记录 项 ) 。 最 后 调用 _db_writeptzr 将 新 记录 加 到 对 应 的 散 列 链 的 链 首 。 
DB 结构 中 的 cnt_stor3 计 数 器 记录 发 生 此 种 情况 的 次 数 。 
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/* 
* Same size data, just replace data record. 
*/ 
.db writedat (db, data, db-»datoff, SEEK SET); 
db->cnt_stor4++; 


re = 0; /* OK */ 


doreturn: /* unlock hash chain locked by .db find and lock */ 
if (un lock(db-»idxfd, db-»chainoff, SEEK SET, 1) « 0) 
err dump("db store: un lock error"); 
return (rc); 


/* 
* Try to find a free index record and accompanying data record 
* of the correct sizes. We're only called by db store. 
*/ 

Static int 

.Qb findfree(DB *db, int keylen, int datlen) 


int re; 
off t offset, nextoffset, saveoffset; 


/* 

* Lock the free list. 

*/ 

if (writew lock(db-»idxfd, FREE OFF, SEEK SET, 1) « 0) 
err dump(" db findfree: writew lock error"); 


/* 
* Read the free list pointer. 
*/ 
Saveoffset - FREE OFF; 
offset = db readptr(db, saveoffset); 


ae 
[657-663] 第 四 种 情况 ， 要 替换 一 条 现存 记录 ， 而 新 数据 记录 的 长 度 与 已 存在 的 记录 的 长 


度 恰 好 一 样 。 这 是 最 容易 的 情况 ， 只 需要 重 写 数 据 记 录 即 可 ， 并 将 计数 器 
(cnt_stor4) 的 值 加 1。 


[664-669] 在 正常 情况 下 ， 设 置 表示 成 功 的 返回 码 ， 然 后 进入 公共 返回 逻辑 。 对 散 列 链 解 


9i (这 把 锁 是 由 调用 _db_fino_anqd_1iock 而 加 上 的 )， 然 后 返 回调 用 者 。 


[670-688] -sb_findfree 函 数 试图 找到 一 个 指定 大 小 的 空闲 素 引 记录 和 相关 联 的 数据 记 


689 
690 
691 
692 


3. -qb_findfree 需 要 对 空闲 链表 加 写 锁 以 避免 与 其 他 使 用 空闲 链表 的 进程 
互相 和 干扰。 在 对 空闲 链表 加 写 锁 后 ， 得 到 空闲 链表 链 首 的 指针 地 址 。 
while (offset != 0) { 
nextoffset = db readidx(db, offset); 


if (strlen(db->idxbuf) == keylen && db->datlen == datlen) 
break; /* found a match */ 
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693 saveoffset = offset; 

694 offset = nextoffset; 

695 } 

696 if (offset == 0) { 

697 rc = -1; /* no match found */ 

698 } eise { 

699 /* 

700 * Found a free record with matching sizes. 

701 * The index record was read in by db readidx above, 
702 * which sets db-»ptrval. Also, Saveoffset points to 
703 * the chain ptr that pointed to this empty record on 
704 * the free list. We set this chain ptr to db-»ptrval, 
705 * which removes the empty record from the free list. 
706 */ 

707 _db_writeptr(db, saveoffset, db-»ptrval); 

708 rc = 0; 

709 /* 

710 * Notice also that db readidx set both db->idxoff 
711 * and db->datoff. This is used by the caller, db store, 
712 * to write the new index record and data record. 

713 */ 

714 ) 

715 /* 

716 * Unlock the free list. 

717 */ 

718 if (un lock(db-»idxfd, FREE OFF, SEEK SET, 1) « 0) 

719 err dump(" db findfree: un lock error"); 

720 return (re); 

721 ) 





[689-695] _dGb_findfree 中 的 while 循 环 遍 历 空 闪 链表， 以 搜寻 一 个 有 匹配 键 长 度 和 数 
据 长 度 的 记录 项 。 在 这 个 简单 的 实现 中 ， 只 有 当 一 个 已 删除 记录 的 键 长 度 及 数 
据 长 度 与 要 加 入 的 新 记录 的 键 长 度 及 数据 长 度 一 样 时 ， 才 重用 已 删除 记录 的 空 
间 。 其 他 更 好 的 重用 删除 空间 的 方法 一 般 更 复杂 。 

[696-714] 如 果 找 不 到 具有 所 要 求 的 键 长 度 和 数据 长 度 的 可 用 记录 ， 则 设置 表示 失败 的 返 
回 码 。 否 则 ， 将 已 找到 记录 的 下 一 个 链表 指针 值 写 至 前 一 记录 的 链表 指针 ， 这 
样 就 从 空闲 链表 中 移 除了 该 记录 。 

[715-721] 一 旦 结束 对 空闲 链表 的 操作 ， 就 释放 写 锁 ， 然 后 对 调用 者 返回 状态 码 。 





722 /* 

723 * Rewind the index file for db nextrec. 

724 * Automatically called by db open. 

725 * Must be called before first db nextrec. 

726 */ 

727 void 

728 db_rewind (DBHANDLE h) 

729 { 

730 DB *db = h; 

731 off t offset; 

732 offset = (db->nhash + 1) * PTR_SZ; /* +1 for free list ptr */ 
733 /* 

734 * We're just setting the file offset for this process 
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* to the start of the index records; no need to lock. 
* +1 below for newline at end of hash table. 
*/ 
if ((db-»idxoff = lseek(db->idxfd, offset«1, SEEK SET)) == -1) 
err dump("db rewind: lseek error"); 


* Return the next sequential record. 
* We just step our way through the index file, ignoring deleted 
* records. db rewind must be called before this function is 
* called the first time. 
*/ 
char * 
db nextrec(DBHANDLE h, char *key) 


{ 


DB *db = h; 
char c; 
char *ptr; 


[722-740] db_rewind 函 数 用 于 把 数据 库 重 置 到 “起 始 状态 ”， 将 索引 文件 的 文件 偏 移 量 


定位 在 索引 文件 的 第 一 条 索引 记录 ( 紧 跟 在 散 列表 之 后 )。( 回 忆 图 20-1 中 索引 
文件 的 结构 。) 


[741-752] db_nexttec 函 数 返回 数据 库 的 下 一 条 记录 ， 返 回 值 是 指向 数据 缓冲 的 指针 。 
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775 


如 果 调 用 者 提供 的 Key 参 数 非 空 ， 那 么 相应 键 复制 到 该 缓冲 中 。 调 用 者 负责 分 配 
可 以 存放 键 的 足够 大 的 缓冲 。 大 小 为 IDXLEN_MRAX 字 节 的 缓冲 足够 存放 任 一 键 。 
记录 按 它们 在 数据 库 文件 中 存放 的 顺序 逐一 返回 ， 因 此 ， 记 录 并 不 按键 值 的 大 
小 排序 。 另 外 ，dib_nextrec 并 不 跟随 散 列 链 表 ， 所 以 也 可 能 读 到 已 删除 的 记 
录 ， 只 是 不 向 调用 者 返回 这 种 已 删除 记录 。 


753 


/* 
* We read lock the free list so that we don't read 
* a record in the middle of its being deleted. 
*/ 
if (readw lock(db-»idxfd, FREE OFF, SEEK SET, 1) < 0) 
err dump("db nextrec: readw lock error"); 


do ( 
/* 
* Read next sequential index record. 
*/ 
if (_db readidx(db, 0) < 0) { f 
ptr = NULL; /* end of index file, EOF */ 
goto doreturn; 
} 
/* 
* Check if key is all blank (empty record). 
*/ 
ptr = db-»idxbuf; 
while ((c = *ptr++) !- 0 && c == SPACE) 


i /* skip until null byte or nonblank */ 
} while (c == 0); /* loop until a nonblank key is found */ 


if (key != NULL) 
strcpy (key, db->idxbuf) ; /* return key */ 
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776 ptr = db readdat(db); /* return pointer to data buffer */ 
777 db->cnt_nextrec++; 


778 doreturn: 


779 if (un_lock(db->idxfd, FREE OFF, SEEK SET, 1) « 0) 
780 err dump("db nextrec: un lock error"); 
781 return(ptr); 


782 





[753-758] 首先 ， 需 要 对 空闲 链表 加 读 锁 ， 使 得 正在 读 该 链表 时 ， 其 他 进程 不 能 从 中 删除 
某 一 记录 。 

[759-773] 调用 _db_readidx 读 下 一 条 记录 。 传 送 给 该 函数 的 偏 移 量 参 数值 为 0%， 以 此 通 
知 该 函数 从 当前 位 置 继续 读 索引 记录 。 因 为 是 逐条 顺序 地 读 索 引文 件 ， 所 以 可 
能 会 读 到 已 删除 的 记录 。 仅 需 返回 有 效 记 录 ， 所 以 跳 过 键 是 全 空格 的 记录 (Hl 
忆 _dpb_dodelete 函 数 以 设置 为 全 空格 方式 清除 键 ) 。 

[774-782] 当 找 到 一 个 有 效 键 时 ， 如 果 调 用 者 已 提供 缓冲 ， 则 将 该 键 复制 至 该 缓冲 。 然 后 
读数 据 记录 ， 并 将 返回 值 设置 为 指向 包含 数据 记录 的 内 部 缓冲 的 指针 值 。 使 统 
计 计 数 器 值 加 1， 对 空闲 链表 解锁 ， 最 后 返回 指向 数据 记录 的 指针 。 

通常 在 下 列 形式 的 循环 中 的 使 用 db_rewind 和 db_nextrec 这 两 个 函数 : 


db rewind (db); 

while ((ptr = db nextrec(db, key)) != NULL) { 
/* process record */ 

} 


前 面 曾 警告 过 ， 记 录 的 返回 没有 一 定 的 次 序 ， 它 们 并 不 按键 的 顺序 返回 。 

如 果 ab_nextrec 函 数 在 循环 中 被 调用 时 数据 库 正 被 修改 ， 则 ab_nextrec 返 回 的 记录 只 
是 变化 中 的 数据 库 在 某 一 时 间 点 的 快照 (snapshot) 。qb_nextrec 被 调用 时 总 是 返回 一 条 “ 正 
确 ” 的 记录 ， 也 就 是 说 它 不 会 返 加 一 条 已 删除 的 记录 ， 但 有 可 能 一 条 记录 刚 被 dp_nextrec 返 
回 后 就 被 删除 ， 类 似 地 ， 如 果 db_nextrec 刚 跳 过 一 条 已 删除 的 记录 ， 这 条 记录 的 空间 就 被 一 
条 新 记录 重用 ， 此 时 除非 用 ab_rewinaq 并 重新 遍历 一 遍 ， 否 则 将 看 不 到 这 条 新 的 记录 。 如 果 
通过 ab_nextrec 获 得 一 份 数据 库 的 准确 的 “冻结 ”的 快照 很 重要 ， 则 应 做 到 在 这 段 时 间 内 没 
有 添加 和 删除 。 

下 面 来 看 ab_nextrec 使 用 的 加 锁 。 因 为 并 不 使 用 任何 的 散 列 链表 ， 也 不 能 判断 每 条 记录 
属于 哪 条 散 列 链 ， 所 以 有 可 能 当 ab_nextrec 读 取 一 条 记录 时 ， 其 索引 记录 正在 被 删除 。 为 了 
防止 这 种 情况 ，ab_nextrec 对 空闲 链表 加 读 锁 ， 这 样 就 可 避免 与 dab_dodelete 和 
_db_findfree 相 互 影 响 。 

在 结束 对 db . c 源 文件 的 解释 说 明之 前 ， 还 需要 说 明 在 向 文件 的 末尾 添加 索引 记录 或 数据 
记录 时 ， 需 要 加 锁 。 在 第 1 情况 和 第 3 种 情况 中 ，qb_store 调 用 _ab_writeidx 和 
_db_writeaat 时 ， 第 3 个 参数 为 0， 第 4 个 参数 为 SEEK_END。 这 里 ， 第 4 个 参数 作为 一 个 标志 
用 来 告诉 这 两 个 函数 ， 新 的 记录 将 被 添加 到 文件 的 末尾 。_dqb_writeiqx 用 到 的 技术 是 对 索引 
文件 加 写 锁 ， 加 锁 的 范围 从 散 列 链 的 末尾 到 文件 的 末尾 。 这 不 会 影响 其 他 数据 库 的 读 用 户 和 写 
用 户 (这 些 用 户 将 对 散 列 链 加 锁 ) ， 但 如 果 其 他 用 户 此 时 调用 GQb_store 来 添加 数据 则 会 被 阻 
止 。_qab_writedaat 使 用 的 方法 是 对 整个 数据 文件 加 写 锁 。 同 样 这 也 不 会 影响 其 他 数据 库 的 读 
用 户 和 写 用 户 (它们 甚至 不 对 数据 文件 加 锁 ) ， 但 如 果 其 他 用 户 此 时 调用 ab_store 来 向 数据 
文件 添加 数据 则 会 被 阻止 (见习 题 20.3) 。 
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为 了 测试 这 一 数据 库 函 数 库 ， 也 为 了 获得 一 些 与 典型 应 用 的 数据 访问 模式 有 关 的 时 间 测 试 
数据 ， 我 们 编写 了 一 个 测试 程序 。 该 程序 接受 两 个 命令 行 参数 ， 要 创建 的 子 进 程 的 个 数 以 及 每 
个 子 进 程 向 数据 库 写 的 数据 库 记 录 的 条 数 (nrec)， 然 后 创建 一 个 空 的 数据 库 (通过 调用 ab_ 
open)， 通 过 forks 创 建 指定 数目 的 子 进程 ， 并 等 待 所 有 子 进程 结束 。 每 个 子 进程 执行 以 下 
mg. 

(1) 向 数据 库 写 mrec 条 记录 。 

(2) 通过 键 值 读 回 mrec 条 记录 。 

(3) 执行 下 面 的 循环 hrec x 5 次 : 

(a) 随机 读 一 条 记录 。 

(b) 每 循环 37 次 ， 随 机 删除 一 条 记录 。 

(c) 每 循环 11 次 ， 添 加 一 条 新 记录 并 读 回 这 条 记录 。 

(d) 每 循环 17 次 ， 随 机 替换 一 条 记录 为 新 记录 。 在 连续 两 次 替换 中 ， 一 次 用 同样 大 小 的 
记录 替换 ， 一 次 用 比 以 前 更 长 的 记录 替换 。 

(4) 将 此 子 进程 写 的 所 有 记录 删除 。 每 删除 一 条 记录 ， 随 机 地 寻找 10 条 记录 。 

随 着 函数 的 调用 次 数 增加 ，DB 结 构 的 cnt_xxx 变 量 记录 对 数据 库 进行 的 操作 数 。 每 个 子 
进程 的 操作 数 一 般 都 会 与 其 他 子 进程 不 一 样 ， 因 为 每 个 子 进程 用 来 选择 记录 的 随机 数 生 成 器 是 
根据 其 进程 卫 来 初始 化 的 。 当 mrec 为 300 时 ， 每 个 子 进程 的 较 典 型 的 操作 计数 见 表 20-2。 


表 20-2 nrec 为 500 时 ， 每 个 子 进程 执行 的 操作 的 典型 计数 





db_store，DB_INSERT， 无 空白 记录 ， 添 加 
db_store，DB_INSERT， 重 用 空白 记录 
db_store，DB_REPLACE， 数 据 长 度 不 同 ， 添 加 


db_store，DB_REPLACE， 数 据 长 度 相 同 


db_store,， 宙 有 找到 记录 
db_fetch， 找 到 记录 
db_fetch， 没 有 找到 记录 


db_delete， 找 到 记录 
dqb_dqelete， 没 有 找到 记录 





读 取 的 次 数 大 约 是 存储 或 删除 的 10 倍 ， 这 可 能 是 许多 数据 库 应 用 程序 的 典型 情况 。 

每 一 个 子 进程 只 对 该 子 进程 所 写 的 记录 执行 这 些 操作 ( 读 取 、 存 储 和 删除 )。 由 于 所 有 的 
子 进程 对 同一 个 数据 库 进行 操作 (虽然 对 不 同 的 记录 )， 所 以 会 使 用 并 发 控制 。 数 据 库 中 的 记 
录 总 条 数 与 子 进程 数 成 比例 增加 。( 当 只 有 一 个 子 进程 时 ， 一 开始 有 nrec 条 记录 写 入 数据 库 ， 当 
有 两 个 子 进程 时 ， 一 开始 有 nrec x 2 条 记录 写 入 数据 库 ， 依 此 类 推 。) 

通过 运行 测试 程序 的 三 个 不 同 版 本 来 比较 加 粗 锁 和 加 细 锁 提供 的 并 发 ， 并 且 比 较 三 种 不 同 
的 加 锁 方式 (不 加 锁 、 建 议 性 锁 和 强制 性 锁 )。 第 一 个 版 本 加 细 锁 ， 用 20.8 节 中 的 源 代码 ， 曾 将 
此 称 为 细 锁 版 本 ， 第 二 个 版 本 通过 改变 加 锁 调用 而 使 用 粗 锁 ，20.6 节 对 此 已 介绍 过 ， 第 三 个 版 
本 将 所 有 加 锁 调用 均 去 掉 ， 这 样 可 以 计算 加 锁 的 开销 。 通 过 改变 数据 库 文件 的 权限 标志 位 ， 还 
可 以 使 第 一 个 版 本 和 第 二 个 版 本 (加 细 锁 和 加 粗 锁 ) 使 用 建议 性 锁 或 强制 性 锁 (本 节 所 有 的 测 
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试 中 ， 仅 对 加 细 锁 的 实现 测量 了 采用 强制 性 锁 的 时 间 ) 。 
本 节 所 有 的 测试 都 在 一 台 运 行 Solaris 9 的 SPARC 系 统 上 进行 。 
1. 单 进程 的 结果 
表 20-3 显 示 了 只 有 一 个 子 进程 运行 时 的 结果 ，nrec 分 别 为 300、1 000 和 2 000, 


表 20-3 单子 进程 、 不 同 的 nrec 和 不 同 的 加 锁 方 法 


不 加 镇 ocd 


nrec 


500 0.42 0.89 ` 1.31 | 0.42 1.17 1.59 0.41 1.04 1.45 0.46 1.49 
1000 | 1.51 3.89 541 | 1.64 4.13 5.78 1.63 4.12 5.76 1.73 6.34 
2000 | 3.91 10.06 13.98 | 4.09 | 10.30 14.39 4.03 | 10.63 14.66 447 16.21 | 20.70 


最 后 12 列 显示 的 是 以 秘 为 单位 的 时 间 。 在 所 有 的 情况 下 ， 用 户 CPU 时 间 加 上 系统 CPU 时 间 
都 近似 地 等 于 时 钟 时 间 。 这 一 组 测试 受 CPU 限 制 而 不 是 受 磁盘 操作 限制 。 

中 间 6 列 (建议 性 锁 ) 对 加 粗 锁 和 加 细 锁 的 结果 基本 一 样 。 这 是 可 以 理解 的 ， 因 为 对 于 单 
个 进程 来 说 加 粗 锁 和 加 细 锁 并 没有 区 别 。 

比较 不 加 锁 和 加 建议 性 锁 ， 可 以 看 到 加 锁 调 用 在 系统 CPU 时 间 上 增加 了 2%~31%。 即 使 这 
些 锁 实际 上 并 没有 使 用 过 (由 于 只 有 一 个 进程 )，fcnt1 系 统 调用 仍 会 有 一 些 时 间 的 开销 。 另 
外 ， 注 意 到 用 户 CPU 时 间 对 于 四 种 不 同 的 加 锁 方案 基本 上 一 样 ， 这 是 因为 用 户 代 码 基本 上 是 一 
样 的 (除了 调用 fcnt1 的 次 数 有 所 不 同 外 )。 

关于 表 20-3 要 注意 的 最 后 一 点 是 强制 性 锁 比 建议 性 锁 增 加 了 大 约 43%~54% 的 系统 CPU 时 间 。 
由 于 对 加 强制 细 锁 和 加 建议 细 锁 的 加 锁 调 用 次 数 是 一 样 的 ， 故 增加 的 系统 开销 来 自 读 和 写 。 

最 后 的 测试 是 尝试 有 多 个 子 进程 的 不 加 锁 的 程序 。 与 预想 的 一 样 ， 结 果 是 随机 的 错误 。 一 
般 情况 包括 : 加 入 到 数据 库 中 的 记录 找 不 到 ， 测 试 程序 异常 退出 等 。 几 乎 每 次 运行 测试 程序 ， 
就 有 不 同 的 错误 发 生 。 这 是 典型 的 竞争 状态 一 多 个 进程 在 没有 任何 加 锁 的 情况 下 修改 同一 个 文 
件 ， 错 误 情 况 不 可 预测 。 

2. 多 进程 的 结果 

下 一 组 测试 主要 查看 粗 锁 和 细 锁 的 不 同 。 前 面 说 过 ， 由 于 加 细 锁 时 数据 库 的 各 个 部 分 被 其 
他 进程 锁 住 的 时 间 比 加 粗 锁 少 ， 所 以 凭 直觉 加 细 锁 应 能 够 提供 更 好 的 并 发 性 。 表 20-4 显 示 了 对 
nrec 取 500、 子 进程 数目 从 1 到 12 的 测试 结果 。 

所 有 的 用 户 时 间 、 系 统 时 间 和 时 钟 时 间 的 单位 均 为 秒 ， 所 有 这 些 时 间 均 是 父 进程 与 所 有 子 
进程 的 总 和 。 关 于 这 些 数据 有 许多 需要 考虑 。 

第 8 列 (标记 为 “A Clock”) 是 加 建议 粗 锁 与 加 建议 细 锁 的 时 钟 时 间 的 时 间 差 ， 从 该 度量 中 
可 以 看 出 使 用 细 锁 得 到 了 多 大 的 并 发 度 。 在 运行 测试 程序 的 系统 上 ， 当 并 发 进程 数 不 多 于 7 时 ， 
加 粗 锁 与 加 细 锁 的 效果 大 致 相当 ， 即 使 多 于 7 个 进程 ， 使 用 细 锁 的 时 间 减 少 也 不 大 (一般 少 于 
3%)， 这 不 禁 让 人 怀疑 使 用 额外 的 代码 来 实现 细 锁 是 否 值得 。 

我 们 希望 从 粗 锁 到 细 锁 时 钟 时间 会 减少 ， 最 后 也 确实 如 此 ， 但 也 曾 预期 就 系统 时 间 而 言 ， 
对 任何 进程 数 ， 细 锁 都 将 保持 比 粗 锁 高 。 这 样 预想 的 原因 是 对 细 锁 调用 了 更 多 次 的 Ecnt1。 如 
果 将 表 20-2 中 的 fcnt1 调 用 次 数 加 起 来 ， 平 均 对 粗 锁 有 21 730 次 ， 细 锁 25 292 次 ( 表 20-2 中 的 每 
个 操作 对 于 粗 锁 要 调用 两 次 fcnt1， 而 对 于 细 锁 前 三 个 db_store 及 记录 删除 (记录 找到 ) 需 
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要 调用 四 次 fcnt1)。 基 于 此 ， 认 为 由 于 增加 了 16% 的 Ecnt1 调 用 次 数 ， 所 以 会 增加 细 锁 的 系统 


时 间 。 然 而 ， 在 测试 中 当 进 程 数 超过 7 后 ， 加 细 锁 的 系统 时 间 反 而 稍 有 下 降 ， 这 不 免 让 人 迷惑 。 
表 20-4 nrec=500 时 ， 不 同 加 锁 方法 的 比较 
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对 此 作 进一步 分 析 ， 发 现 减少 的 原因 是 ;对 粗 锁 而 言 ， 保 持 这 种 锁 的 时 间 会 比较 长 ， 于 是 
增加 了 其 他 进程 因 这 种 锁 而 阻塞 的 可 能 性 ， 而 对 细 锁 而 言 ， 由 于 加 锁 的 时 间 较 短 ， 于 是 进程 为 
此 而 阻塞 的 机 会 也 就 比较 少 。 如 果 分 析 和 运行 12 个 数据 库 进程 的 系统 行为 ， 将 会 看 到 加 粗 锁 时 的 
进程 切换 次 数 是 加 细 锁 时 的 3 倍 。 这 就 意味 着 在 使 用 细 锁 时 ， 进 程 在 锁 上 阻塞 的 机 会 要 少 得 多 。 

最 后 一 列 (标记 为 “A percent”) 是 从 加 建议 细 锁 到 加 强制 细 锁 的 系统 CPU 时 间 的 百分比 增 
量 。 这 与 在 表 20-3 中 看 到 的 强制 性 锁 显 著 增 加 ( 约 33%~66%) 系统 时 间 是 一 致 的 。 

由 于 所 有 这 些 测 试 的 用 户 代码 几乎 一 样 (对 加 建议 细 锁 和 强制 细 锁 增加 了 一 些 fcnt1 调 
用 ) ， 预 期 对 每 一 行 的 用 户 CPU 时 间 应 基本 一 样 。 

表 20-4 的 第 一 行 与 表 20-3 中 的 nrec 取 500 的 那 一 行 很 相似 。 这 与 预期 相 一 致 。 

图 20-4 是 表 20-4 中 加 建议 细 锁 的 数据 图 。 图 中 绘制 了 进程 数 从 1 到 12 的 时 钟 时 间 ， 也 绘制 了 
用 户 CPU 时 间 除 以 进程 数 后 的 每 进程 用 户 CPU 时 间 ， 另外 还 绘制 了 系统 CPU 时 间 除 以 进程 数 后 
的 每 进程 系统 CPU 时 间 。 

注意 到 这 两 个 每 进程 CPU 时 间 都 是 线性 的 ， 但 时 钟 时 间 是 非 线性 的 。 可 能 的 原因 是 ， 当 进 
程 数 增 大 时 ， 操 作 系统 用 于 进行 进程 切换 的 CPU 时 间 增 多 。 操 作 系统 的 开销 是 使 时 钟 时 间 增 加 ， 
但 不 会 影响 单个 进程 的 CPU 时 间 。 

用 户 CPU 时 间 随 进程 数 增加 的 原因 可 能 是 因为 数据 库 中 有 了 更 多 的 记录 ， 每 一 条 散 列 链 更 
长 ， 所 以 _ab_find_and_lock 函 数 平均 要 运行 更 长 时 间 来 找到 一 条 记录 。 


20.10 小 结 


本 章 详细 介绍 了 一 个 数据 库 函 数 库 的 设计 与 实现 。 考 虑 到 篇 幅 ， 使 这 个 函数 库 尽 可 能 小 和 
简单 ， 但 也 包括 了 多 进程 并 发 控制 需要 的 对 记录 加 锁 的 功能 。 

此 外 ， 还 使 用 不 同 数目 的 进程 ， 以 及 不 同 的 加 锁 方 法 : 不 加 锁 、 建 议 性 锁 〈 细 锁 和 粗 锁 ) 
和 强制 性 锁 ， 研 究 了 这 个 函数 库 的 性 能 。 可 以 看 到 加 建议 性 锁 比 不 加 锁 在 时 钟 时 间 上 增加 了 约 
10%， 加 强制 性 锁 比 建议 性 锁 耗 时 再 增加 约 33%~66%。 
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图 20-4 表 20-4 中 使 用 建议 细 锁 的 数据 


习题 


20.1 


20.2 


20.3 


20.4 
20.5 
20.6 


20.7 
20.8 


在 _ab_daodelete 中 使 用 的 加 锁 是 比较 保守 的 。 例 如 ， 如 果 等 到 真正 要 用 空闲 链表 时 再 
加 锁 ， 则 可 获得 更 大 的 并 发 度 。 如 果 将 调用 writew_lock 移 到 调用 _dapb_writedat 和 
_db_readptr 之 间 会 发 生 什 么 呢 ? 


如 果 ab_nextrec 不 对 空闲 链表 加 读 锁 而 它 所 读 的 记录 正在 被 删除 ， 描 述 在 怎样 的 情况 


下 ，db_nextrec 会 返回 一 个 正确 的 键 但 是 数据 记录 却 是 空 的 (提示 :查看 _db_ 
dodelete), 

在 20.8 节 的 结尾 部 分 ， 描 述 了 _dpb_writeidx 和 ._db_writedat 的 加 锁 ， 曾 说 过 这 种 加 
锁 不 会 干涉 除了 调用 db_store 外 的 其 他 的 读 进程 和 写 进程 。 如 果 改 为 强制 性 锁 ， 这 还 
成 立 吗 ? 

怎样 把 Esync 集 成 到 这 个 数据 库 函数 库 中 ? 

在 db_store 中 ， 先 写 数 据 记 录 ， 然 后 再 写 索 引 记 录 。 如 果 将 次 序 颠 倒 ， 会 发 生 什么 ? 
建立 一 个 新 的 数据 库 并 写 入 一 些 记录 。 写 一 个 程序 调用 db_nextrec 来 读数 据 库 中 的 每 
条 记录 ， 并 调用 _ab_hash 来 计算 每 条 记录 的 散 列 值 。 根 据 每 条 散 列 链 上 的 记录 数 画 出 
直方 图 。_db_hash 中 的 散 列 函 数 是 否 适当 ? 

修改 数据 库 函 数 ， 使 得 索引 文件 中 散 列 链 的 数目 可 以 在 数据 库 建立 时 指定 。 

比较 两 种 情况 下 数据 库 函 数 的 性 能 : (a) 数据 库 与 测试 程序 在 同一 台 机 器 上 ，(b) 数据 库 
与 测试 程序 在 不 同 的 机 器 上 ， 经 由 NFS 进 行 访问 。 这 个 数据 库 函 数 库 提供 的 记录 锁 机 制 
还 能 工作 吗 ? 
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与 网 络 打印 机 通信 


21.1 引言 


现在 开发 与 网 络 打 印 机 通信 的 程序 ， 这 些 打印 机 通过 以 太 网 与 多 个 计算 机 互联 ， 并 且 通 常 
既 支 持 纯 文本 文件 又 支持 PostScript 文 件 。 尽 管 有 一 些 应 用 程序 也 支持 其 他 的 通信 协议 ， 但 一 般 
使 用 网 络 打 印 协议 (Internet Printing Protocol, IPP) 与 打印 机 通信 。 

我 们 将 描述 两 个 程序 ， 一 个 打印 假 脱 机 守护 进程 (print spooler daemon) ， 用 以 将 作业 发 送 
到 打印 机 ， 一 个 命令 行程 序 ， 用 以 将 打印 作业 提交 到 假 脱 机 守护 进程 。 打 印 假 脱 机 必须 处 理 很 
多 操作 (与 客户 端 通信 来 提交 作业 ， 与 打印 机 通信 ， 读 文件 ， 扫 描 目 录 ， 等 等 ) ， 这 就 提供 了 
一 个 机 会 来 使 用 前 面 章 节 所 提 到 的 函数 。 例 如 ， 使 用 线程 (第 11 章 和 第 12 章 ) 来 简化 打印 假 脱 
机 程序 的 设计 ， 使 用 套 接 字 (第 16 章 ) 在 调度 文件 打印 的 程序 和 打印 假 脱 机 程序 之 间 通 信 ， 也 
可 以 在 打印 假 脱 机 程序 与 网 络 打印 机 之 间 通 信 。 


21.2 网 络 打印 协议 


网 络 打 印 协议 IPP 为 建立 基于 网 络 的 打印 系统 指定 了 通信 规则 。 通 过 将 IPP 服 务 器 媒人 到 带 
网 卡 的 打印 机 中 ， 打 印 机 就 能 够 对 许多 计算 机 系统 的 请 求 加 以 服务 。 这 些 计算 机 系统 实际 上 并 
不 需要 在 同一 个 物理 网 络 中 。 因 为 I PP 是 建立 在 标准 的 因特网 协议 上 的 ， 所 以 任何 一 台 能 够 与 
打印 机 建立 TCP/IP 连 接 的 计算 机 都 能 向 打印 机 提交 打印 作业 。 

特别 地 ，IPP 建 立 在 超 文本 传输 协议 (Hypertext Transfer Protocol, HTTP) 上 ( 见 21.3 节 )， 
HTITP 又 建立 在 TCP/IP 上 。IPP 报 文 的 结构 如 图 21-1 所 示 。 


Ethernet IP TCP HTTP IPP 要 打印 的 
首部 首部 首部 . 首部 首部 数据 


图 21-1 IPP 报 文 结构 


IPP 是 请 求 响应 协议 。 客 户 端 发 送 请 求 到 服务 器 ， 服 务 器 用 响应 报 文 回答 这 个 请 求 。IPP 首 
部 包含 一 个 字段 来 指示 所 需 操作 ， 这 些 操作 可 以 定义 成 提交 打印 作业 、 取 消 打 印 作 业 、 和 获取 作 
业 属 性 、 获 取 打印 机 属性 、 暂 停 和 重 起 打印 机 、 挂 起 一 个 作业 和 释放 一 个 挂 起 的 作业 。 

图 21-2 显 示 了 IPP 报 文 首部 的 结构 。 首 部 两 个 字 节 表示 PP 版 本 号 ， 对 于 1.1 版 本 协议 ,每 个 
字 节 的 值 是 1。 对 于 请 求 协议 ， 接 下 来 两 个 字 节 包含 一 个 值 用 以 指示 所 请 求 的 操作 ， 对 于 响应 
协议 ， 这 两 个 字 节 包含 一 个 状态 码 。 

接 下 来 的 四 个 字 节 包含 一 个 整数 以 标识 请 求 。 接 着 是 可 选 的 属性 ， 然 后 用 属性 结束 标志 终 
止 。 紧 接着 属性 结束 标志 之 后 是 任何 与 请 求 相 关联 的 数据 。 
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在 首部 ， 整 数 以 有 符号 二 进 制 补 码 以 及 大 端 字 节 序 ( 即 网 络 字 节 序 ) 方式 存储 。 属 性 按照 
组 来 存储 。 每 个 组 都 以 标识 该 组 的 一 个 字 节 开始 。 在 每 一 个 组 中 ， 属 性 通常 表示 为 ， 1 字 节 的 
标志 ， 然 后 是 2 字 节 的 名 字 长 度 ， 接 着 是 属性 名 字 ， 然 后 是 2 字 节 的 属性 值 长 度 ， 最 后 是 属性 值 
[54] 本 身 。 属 性 值 可 以 编码 成 字符 电 、 二 进 制 整 数 或 者 更 为 复杂 的 结构 ， 例 如 日 期 /时 间 愉 。 
图 21-3 显 示 了 attributes-~charset 属 性 是 如 何 编码 成 值 utf-8 的 。 


属性 标志 = 0x 47 








图 21-2 IPP 首 部 结构 图 21-3 IPP 属 性 编码 示例 
根据 所 请 求 的 操作 ， 一 些 属性 需要 在 请 求 报 文中 提供 ， 而 另外 一 些 是 可 选 的 。 例 如 ， 表 21-1 
显示 了 用 于 打印 作业 请 求 的 属性 。 


表 21-1 打印 作业 请 求 的 属性 


attributes-charset D text 或 name 类 型 属性 所 使 用 的 字符 集 

attributes-natural-language DA text 或 name 类 型 属性 所 使 用 的 自然 语言 

printer-uri 必 打印 机 的 统一 资源 标识 符 (Universal Resource Identifier) 

requesting-user-name i 提交 作业 的 用 户 名 字 (如 果 可 以 ， 用 于 鉴别 ) 

job-name j 用 于 区 别 多 个 作业 的 作业 名 字 

ipp-attripute-fidelity j 如 果 为 真 ， 告 诉 打印 机 如 果 属 性 不 匹配 就 拒绝 作业 ， 否 
则 ， 打 印 机 尽 可 能 打印 作业 

document-name i 文档 名 字 ( 例 如， 适合 打印 一 个 旗 标 ) 

document- format j 文档 格式 ( 纯 文本 、PostScript 等 ) 

document-natural-language i 文档 的 自然 语言 

compression j 压缩 文档 数据 的 算法 

job-k-octets j 以 1 024 字 节 单 位 计算 的 文档 大 小 

job-impressions i 作业 中 提交 的 图 的 数量 (这 里 的 “图 ”是 嵌入 在 页 面 的 
图 像 ) 数量 

job-media-sheets j 该 作业 打印 张 数 


IPP 首 部 包含 了 文本 和 二 进 制 混合 数据 。 属 性 名 存储 为 文本 ， 而 数据 大 小 存储 为 二 进 制 整 
数 。 这 使 得 构建 和 分 析 首 部 的 过 程 变 得 复杂 ， 因 为 需要 考虑 诸如 网 络 字 节 序 、 主 机 处 理 器 是 否 
能 在 任意 字 节 边界 编 址 整数 之 类 的 问题 。 一 个 较 好 的 可 选 方案 是 将 首部 设计 成 仅仅 包含 文本 。 
这 样 以 稍微 膨胀 一 些 协 议 报 文 为 代价 简化 处 理 过 程 。 

IPP 由 一 系列 请 求 评注 (Requests For Comments, RFC) 文档 说 明 ， 文档 可 以 从 
http://www.pwg .org/ipp 获 得 。 尽 管 有 许多 其 他 文档 来 进一步 说 明 管理 过 程 、 作 业 属 性 等 
信息 ， 但 主要 文档 在 表 21-2 中 列 出 。 





-l 
A 
CA 
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表 21-2 主要 的 IPP RFC 


Design Goals for an Internet Printing Protocol (了 PP 设计 目标) 
Rationale for the Structure of the Model and Protocol for the Internet Printing Protocol (了 PP 模型 与 协议 架构 


之 基本 原理 ) 
Internet Printing Protocol/1.1: Model and Semantics (IPP/1.1; 模型 与 语义 ) 
Internet Printing Protocol/1.1: Encoding and Transport (IPP/1.1; 编码 与 传输 ) 
Internet Printing Protocol/1.1: Implementor's Guide (IPP/1.1， 实 现 者 指南 ) 


21.3 超 文 本 传输 协议 


HTTP V1.1 由 RFC 2616 说 明 。HTTP 也 是 请 求 响应 协议 。 请 求 报 文 包含 一 个 开始 行 ， 跟 着 
是 首部 行 ， 一 个 空白 行 ， 然 后 是 一 个 可 选 的 实体 主体 。 在 目前 这 种 情况 下 ， 实 体 主体 包含 IPP 
首部 和 数据 。 

HITP 首 部 是 ASCIH 码 ， 每 行 以 加 车 (Nr) 和 换行 An) 符 结束 。 开 始 行 包 含 一 个 method 来 
指示 客户 端 请 求 的 操作 ， 一 个 统一 资源 定位 符 (Uniform Resource Locator, URL) 来 描述 服务 器 
和 协议 ， 一 个 字符 串 来 表示 HITP 版 本 。IPP 所 用 的 方法 仅 为 P2ST， 用 于 将 数据 发 送 到 服务 器 。 

首部 行 指定 属性 ， 例 如 实体 主体 的 格式 和 长 度 。 一 个 首部 行 包含 一 个 属性 名 字 ， 跟 以 一 个 
冒号 ， 可 选 的 空格 符 ， 然 后 是 属性 值 ， 最 后 以 加 车 和 换行 符 结束 。 例 如 ， 为 了 指定 实体 主体 包 
含 IPP 报 文 ， 应 包含 如 下 的 首部 行 : 


Content-Type: application/ipp 


HTTP 响 应 报 文中 的 开始 行 包含 一 个 版 本 字符 串 ， 跟 着 是 一 个 数字 状态 码 和 状态 消息 ， 以 
回 车 和 换行 符 结束 。HTTP 响 应 报 文 的 剩余 部 分 格式 与 请 求 报 文 相同 ， 首 部 之 后 是 一 个 空白 行 ， 
然后 是 一 个 可 选 的 实体 主体 。 

下 面 是 一 个 对 于 作者 的 打印 机 的 打印 请 求 的 HTTP 首 部 样 例 。 


POST /phaser860/ipp HTTP/1.1°M 
Content-Length: 21931^M 
Content-Type: application/ipp^M 
Host: phaser860:ipp"M 

^M 





每 行 后 面 的 ^M 是 换行 符 前 的 回 车 符 。 换行 符 不 能 被 显示 成 可 打印 字符 。 注 意 除 了 回 车 和 换行 符 ， 
首部 的 最 后 一 行 是 空 的 。 


21.4 打印 假 脱 机 技术 


本 章 中 开发 的 程序 是 一 个 简单 的 打印 假 脱 机 程序 的 基础 。 一 个 简单 的 用 户 命令 发 送 文件 到 
打印 假 脱 机 程序 ， 假 脱 机 程序 将 其 保存 到 磁盘 ， 把 请 求 送 入 队列 ， 最 终 将 文件 发 送 到 打印 机 。 

所 有 的 UNIX 系 统 至 少 提供 一 个 打印 假 脱 机 系统 。FreeBSD 安 装 BSD 的 打印 假 脱 机 系统 一 一 
LPD (参见 1pa(8) 和 Stevens [1990] 第 13 章 )。Linux 和 Mac OS XA $&; CUPS—— Common UNIX 
Printing System (参见 cupsa(8)) 。Solaris 提 供 标准 的 SystemV printer spooler (参见 1p(1) 和 
lpschedq(1M))。 在 本 章 中 ， 兴 趣 不 在 于 这 些 假 脱 机 系统 本 身 ， 而 在 于 如 何 与 网 络 打印 机 通信 。 
需要 开发 一 个 假 脱 机 系统 能 够 解决 多 用 户 访问 单一 资源 (打印 机 ) 的 问题 。 

使 用 一 个 简单 的 命令 行程 序 读 取 文 件 ， 将 其 发 送 到 打印 假 脱 机 守护 进程 。 这 个 命令 行程 序 有 
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一 个 选项 用 来 强制 将 文件 按照 纯 文本 对 待 (默认 是 PostScript 文 件 )。 这 个 命令 行程 序 是 print。 
在 打印 假 脱 机 守护 进程 printa 中 ， 使 用 多 线程 来 分 担 守护 进程 需要 完成 的 任务 。 
“一 个 线程 在 套 接 字 上 监听 从 运行 print 命 令 的 客户 端 发 来 的 新 打印 请 求 。 
。 对 于 每 个 客户 端 产 生 一 个 独立 的 线程 ， 用 以 将 要 打印 的 文件 复制 到 假 脱 机 区 域 。 
* 一 个 线程 与 打印 机 通信 ， 一 次 发 送 一 个 队列 中 的 作业 。 
* 一 个 线程 处 理 信和 号。 
图 21-4 显 示 如 何 将 这 些 组 件 整合 在 一 起 。 





图 21-4 打印 假 脱 机 组 件 


打印 配置 文件 是 /etc/printer .conf。 该 文件 标识 了 运行 打印 假 脱 机 守护 进程 的 服务 器 
| [757] 主 机 名 字 和 网 络 打印 机 的 主机 名 字 。 以 Printserver 关 键 字 开 始 的 行 标识 了 假 脱 机 守护 进程 ， 
关键 字 之 后 是 空格 符 和 服务 器 主机 名 字 ， 以 printer 关 键 字 开 始 的 行 标识 了 打印 机 ， 关 键 字 之 
1 后 是 空格 符 和 打印 机 的 主机 名 字 。 

' 一 个 打印 机 配置 文件 样 例 可 能 包含 下 列 行 : 


printserver blade 
printer phaserB60 


其 中 ，blade 是 运行 打印 假 脱 机 守护 进程 的 计算 机 系统 主机 名 字 ，phaser860 是 网 络 打 印 机 
的 主机 名 字 。 


安全 


拥有 超级 用 户 特 权 的 程序 可 能 让 计算 机 系统 受到 攻击 。 这 些 程序 通常 并 不 比 其 他 程序 更 脆 
弱 ， 但 是 被 攻破 后 将 导致 攻击 者 能 够 完全 访问 计算 机 系统 。 

本 章 中 的 打印 假 脱 机 守护 进程 拥有 超级 用 户 特权 ， 在 这 个 例子 中 能 够 将 一 个 特权 TCP 端 口 
号 绑 定 一 个 套 接 字 。 为 使 得 守护 进程 更 加 能 够 抵御 攻击 ， 可 以 ; 

“按照 最 少 特 权 的 原则 (8.1145). 设计 守护 进程 程序 。 在 获得 绑 定 到 特权 端口 地 址 的 套 接 字 

之 后 ,. 可 以 将 守护 进程 的 用 户 和 组 的 ID 更 改 为 非 root (例如 1p)。 所 有 用 于 存储 队列 中 

打印 作业 的 文件 和 目录 的 拥有 者 应 该 是 非特 权 用 户 。 如 果 被 攻击 ， 这 种 情况 下 守护 进程 

程序 给 予 攻击 者 的 只 有 打印 子 系统 。 虽 然 这 仍 是 一 个 隐患 ， 但 是 比 攻 击 者 可 以 完全 访问 

系统 的 危害 性 大 大 降低 。 

。 审 查 守护 进程 程序 源 代码 中 已 知 的 所 有 脆弱 漏洞 ， 比 如 缓冲 区 溢出 。 

* 对 不 期 望 或 者 可 疑 的 行为 做 日 志 ， 这 样 管理 员 可 以 对 此 引起 注意 并 作 进 一 步调 查 。 
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21.5 ARB 


本 章 的 源 代 码 有 五 个 文件 ， 不 包括 在 前 面 章节 中 所 用 的 一 些 公共 库 例 程 ; 
ipp.h 包含 IPP 定 义 的 头 文 件 

print.h ”包含 常用 的 常数 、 数 据 结构 定义 以 及 工具 例 程 声明 的 头 文件 
util.c 用 于 两 个 程序 的 工具 例 程 

print.c ”用 于 打印 文件 的 命令 行程 序 C 源 文件 

printd.c 打印 假 脱 机 守护 进程 的 C 源 文件 

接 下 来 按照 所 列 次 序 依次 学 习 每 个 文件 。 从 ipp .h 头 文件 开始 。 





1 #ifndef _IPP H 

2 #define IPPH 

3 /* 

4 * Defines parts of the IPP protocol between the scheduler 
5 * and the printer. Based on RFC2911 and RFC2910. 

6 */ 

7 /* 

8 * Status code classes. 

9 */ 

10 #define STATCLASS OK(x) ((x) >= 0x0000 && (x) <= OxOOff) 
11 #define STATCLASS INFO (x) ((x) >= 0x0100 && (x) <= OxOlff) 
12 #define STATCLASS REDIR (x) ((x) >= 0x0200 && (x) <= OxO2ff) 


13 define STATCLASS CLIERR(X) ((x) >= 0x0400 && (x) <= OxO4ff) 
14 #define STATCLASS SRVERR(x) ((x) >= 0x0500 && (x) <= 0x05ff) 


15 /* 

16 * Status codes. 

17 */ 

18 #define STAT OK Ox0000 /* success */ 


19 #define STAT OK ATTRIGN 0x0001 /* OK; some attrs ignored */ 
20 #define STAT OK ATTRCON 0x0002 /* OK; some attrs conflicted */ 


21 #define STAT CLI BADREQ 0x0400 ./* invalid client request */ 

22 #define STAT CLI FORBID 0x0401 /* request is forbidden */ 

23 #define STAT CLI NOAUTH 0x0402 /* authentication required */ 

24 #define STAT CLI NOPERM 0x0403 /* client not authorized */ 

25 #define STAT CLI NOTPOS 0x0404 /* request not possible */ 

26 #define STAT CLI TIMOUT 0x0405 /* client too slow */ 

27  $define STAT CLI NOTFND 0x0406 /* no object found for URI */ 

28 #define STAT CLI OBJGONE 0x0407 /* object no longer available */ 
29 #define STAT CLI TOOBIG 0x0408 /* requested entity too big */ 
30 #define STAT CLI TOOLNG 0x0409 /* attribute value too large */ 
31 #define STAT CLI BADFMT 0x040a /* unsupported doc format */ 

32 #define STAT CLI NOTSUP Ox040b /* attributes not supported */ 
33 #define STAT CLI NOSCHM 0x040c /* URI scheme not supported */ 
34 #define STAT CLI NOCHAR 0x040d /* charset not supported */ 

35 #define STAT CLI ATTRCON 0x040e /* attributes conflicted */ 

36 #define STAT CLI NOCOMP Ox040f /* compression not supported */ 
37 #define STAT CLI COMPERR 0x0410 /* data can't be decompressed */ 
38 (define STAT CLI FMTERR 0x0411 /* document format error */ 

39 #define STAT CLI ACCERR 0x0412 /* error accessing data */ 





[1-14] ipp.h 以 标准 的 #ifdef 开 始 ， 用 于 防止 同一 文件 被 包含 两 次 的 错误 。 然 后 定 
义 IPP 状 态 码 的 类 (参见 RFC2911 的 13 小 节 ) 
[15-39] ”定义 基于 RFC 2911 的 状态 码 ， 但 是 本 程序 中 并 不 使 用 ， 这 些 状态 码 的 使 用 留 给 
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读者 作为 练习 (参见 习题 21.1)。 

40 #define STAT SRV INTERN 0x0500 /* unexpected internal error */ 

41 #define STAT SRV NOTSUP 0x0501 /* operation not supported */ 

42 #define STAT SRV UNAVAIL 0x0502 /* service unavailable */ 

43 #define STAT SRV BADVER 0x0503 /* version not supported */ 

44 #define STAT SRV DEVERR 0x0504 /* device error */ 

45 #define STAT SRV TMPERR 0x0505 /* temporary error */ 

46 (define STAT SRV RBJECT  0x0506 /* server not accepting jobs */ 

47 #define STAT SRV TOOBUSY 0x0507 /* server too busy */ 

48 #define STAT SRV CANCEL 0x0508 /* job has been canceled */ 

49 #define STAT SRV NOMULTI 0x0509 /* multi-doc jobs unsupported */ 

50 /* 

51 * Operation IDs 

52 */ 

53 #define OP PRINT JOB 0x02 

54 #define OP PRINT URI 0x03 

55  #define OP VALIDATE JOB 0x04 

56 #define OP CREATE JOB 0x05 

57  &define OP SEND DOC 0x06 

58 Hdefine OP SEND URI 0x07 

59 #define OP CANCEL JOB 0x08 

60 #define OP GET JOB ATTR 0x09 

61 define OP GET JOBS 0x0a 

62 #define OP GET PRINTER ATTR 0x0b 

63 #define OP HOLD JOB 0x0c 

64 #define OP_RELEASE_JOB 0x0d 

65 #define OP_RESTART_JOB Ox0e 

66 #define OP PAUSE PRINTER 0x10 

67 #define OP RESUME PRINTER 0x11 

68  #define OP PURGE JOBS 0x12 

69 /* 

70 * Attribute Tags. 

71 */ 

72 #define TAG OPERATION ATTR 0x01 /* operation attributes tag */ 

73 #define TAG JOB ATTR 0x02 /* job attributes tag */ 

74 #define TAG END OF ATTR 0x03 /* end of attributes tag */ 

75  #define TAG PRINTER ATTR 0x04 /* printer attributes tag */ 

76 #define TAG UNSUPP ATTR 0x05 /* unsupported attributes tag */ 

[40-49] ”继续 定义 状态 码 。0x500 到 0x5ff 是 服务 器 错误 码 。RFC 2911 中 13.1.1 节 到 
13.1.5 节 描述 了 所 有 的 状态 码 。 

[50-68] ”接着 定义 各 种 操作 ID。IPP 中 定义 的 每 个 操作 (参见 RFC 2911 的 4.4.15 节 ) 都 有 
一 个 ID。 在 本 例 中 ， 仅 用 到 打印 作业 操作 。 

[69-76] ”属性 标志 限定 了 IPP 请 求 报 文 和 响应 报 文中 的 属性 组 。 这 些 标志 值 定义 在 RFC 
2910 的 3.5.1 节 中 。 

77 /* 

78 * Value Tags. 

79 */ 

80 #define TAG UNSUPPORTED 0x10 /* unsupported value */ 

81 #define TAG UNKNOWN 0x12 /* unknown value */ 

82 #define TAG NONE 0x13 /* no value */ 

83 #define TAG INTEGER Ox21 /* integer */ 

84 #define TAG BOOLEAN 0x22 /* boolean */ ‘ 
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85 #define TAG ENUM 0x23 /* enumeration */ 
86 #define TAG OCTSTR 0x30 /* octetString */ 
87 #define TAG DATETIME 0x31 /* dateTime */ 
88 #define TAG RESOLUTION 0x32 /* resolution */ 
89 #define TAG INTRANGE 0x33 /* rangeOfInteger */ 
90 #define TAG TEXTWLANG 0x35 /* textWithLanguage */ 
91 #define TAG NAMEWLANG 0x36 /* nameWithLanguage */ 
92 #define TAG TEXTWOLANG 0x41 /* textWithoutLanguage */ 
93 #define TAG NAMEWOLANG 0x42 /* nameWithoutLanguage */ 
94 #define TAG KEYWORD Ox44 /* keyword */ 
95 #define TAG URI Ox45 /* URI */ 
96 #define TAG URISCHEME 0x46 /* uriScheme */ 
97 #define TAG CHARSET 0x47 /* charset */ 
98 #define TAG NATULANG 0x48 /* naturalLanguage */ 
99 #define TAG MIMETYPE 0x49 /* mimeMediaType */ 
100 struct ipp hdr { 
101 int8 t major version; /* always 1 */ 
102 int8 t minor version; /* always 1 */ 
103 union { 
104 intli6 t op; /* operation ID */ 
105 inti6 t st; /* status */ 
106 } u; 
107 int32_t request_id; /* request ID */ 
108 char attr group[1]; /* start of optional attributes group */ 
109 /* optional data follows */ 
110 Hh 
111 #define operation u.op 
112 #define status u.st 
113 #endif /* IPP H */ 
[77-99] “ 值 标 志 指 示 每 个 属性 和 参数 的 格式 ， 由 RFC 2910 的 3.5.2 节 定义 。 


[100-113] 定义 IPP 首 部 的 结构 。 请 求 报 文 与 响应 报 文 的 首部 一 样 ， 除 了 请 求 中 的 操作 ID 被 
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响应 中 的 状态 码 代替。 


在 头 文件 尾部 用 #enaif 来 匹配 文件 开始 处 的 #ifdef。 
下 一 个 文件 是 print .h 头 文件 。 


#ifndef PRINT H 
#define PRINT H 
/* 
* Print server header file. 
*/ 
#include «sys/socket.h» 
#include «arpa/inet.h» 
#if defined(BSD) || defined (MACOS) 
#include <netinet/in.h> 
#endif 
#include <netdb.h> 
#include <errno.h> 


#define CONFIG FILE "/etc/printer.conf" 
#define SPOOLDIR "/var/8pool/printer" 
#define JOBFILE "jobno" 

#define DATADIR "data" 

#define REQDIR "reqs" 

#define FILENMSZ 64 
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19 
20 
21 
22 


23 
24 
25 


26 
27 
28 
29 
30 


[1-12] 
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#define FILEPERM ~ (S IRUSR|S IWUSR) 
#define USERNM MAX 64 
#define JOBNM MAX 256 
#define MSGLEN MAX 512 


#ifndef HOST NAME MAX 
#define HOST NAME MAX 256 


#endif N 
#define IPP_PORT 631 

#define QLEN 10 

#define IBUFSZ 512 /* IPP header buffer size */ 
#define HBUFSZ 512 /* HTTP header buffer size */ 
#define IOBUFSZ 8192 /* data buffer size */ 


在 这 个 头 文件 中 包含 所 需要 的 所 有 头 文件 。 应 用 程序 只 需 简 单 地 包含 print .h, 
而 不 需要 跟踪 所 有 的 头 文件 依赖 关系 。 


[13-17] ”定义 实现 所 需 的 文件 和 目录 。 需 要 打印 的 文件 副本 存放 在 目录 /var/spool/ 


printer/data 中 ， 对 于 每 个 请 求 的 控制 信息 存储 在 目录 /var/spool/ 
printer/regqs 中 。 包 含 下 一 个 作业 号 的 文件 是 /var/spool/printer/ 


jobno, 


[18-30] ”接着 定义 限制 和 常数 。FILEPERM 是 创建 提交 打印 文件 副本 时 使 用 的 权限 ， 该 


31 
32 
33 


34 
35 
36 
37 
38 
39 
40 
41 


42 
43 
44 
45 
46 
47 
48 
49 
50 


51 
52 
53 
54 


55 
56 
57 
58 


权限 很 受 限 , 因为 不 想 让 一 个 普通 用 户 能 够 读 取 另 外 一 个 用 户 等 待 打印 的 文件 。 
IPP 定 义 成 使 用 端口 631。QLEN 是 传 给 1isten 的 backlog 参 数 (详情 参见 16.4 
小 节 ) 。 


#ifndef ETIME 
#define ETIME ETIMEDOUT 
Hendif 


extern int getaddrlist(const char *, const char *, 
Struct addrinfo **); 
extern char *get printserver (void); 
extern struct addrinfo *get printaddr (void); 
extern ssize t tread(int, void *, size t, unsigned int); 
extern ssize t treadn(int, void *, size t, unsigned int); 
extern int connect retry(int, const struct sockaddr *, socklen t); 
extern int initserver(int, struct sockaddr *, socklen t, int); 


/* 
* Structure describing a print request. 
*/ 
struct printreq { 
long size; /* size in bytes */ 
long flags; /* see below */ 
char usernm[USERNM MAX]; /* user's name */ 
char jobnm[JOBNM MAX]; /* job's name */ 
E 
/* 
* Request flags. 
*/ 
#define PR_TEXT 0x01 /* treat file as plain text */ 
/* 


* The response from the spooling daemon to the print command. 
*/ 


struct printresp { 
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59 long retcode; /* O=success, !O=error code */ 

60 long jobid; /* job ID */ 

61 char msg[MSGLEN MAX]; . /* error message */ 

62 $ 

63 #endif /* PRINT H */ 

[31-33] ”由 于 一 些 平台 不 定义 错误 ETIME， 因 此 另外 定义 一 个 错误 码 ， 使 得 在 这 些 系统 
上 有 意义 。 

[34-41] 接着， 声明 所 有 包含 在 util.c 中 的 公共 例 程 ( 接 下 来 将 考查 这 些 例 程 ) 。 注 意 
程序 清单 16-2 中 的 connect_retry 国 数 和 程序 清单 16-9 中 的 initservezr 国 
数 没 有 包含 在 util .c 中 。 

[42-63] printreq 和 printresp 结 构 定义 了 print 命 令 行 程序 和 打印 假 脱 机 守护 进程 之 


闻 的 协议 。print 命 令 发 送 printreq 结 构 到 打印 假 脱 机 守护 进程 ， 该 结构 定 
义 了 用 户 名 字 、 作 业 名 字 与 文件 大 小 。 打 印 假 脱 机 守护 进程 用 printresp 结 构 
回应 ， 该 结构 包括 返回 码 、 作 业 ID 和 错误 消息 ( 当 请 求 失败 时 )。 


接 下 来 将 考查 文件 util.c， 该 文件 包含 工具 例 程 。 








1 #include "apue.h" 

2 #include "print.h" 

3 #include <ctype.h> 

4 #include «sys/select.h» 

5 #define MAXCFGLINE 512 

6 #define MAXKWLEN 16 

7 Hdefine MAXFMTLEN 16 

8 /* 

9 * Get the address list for the given host and service and 
10 * return through ailistpp. Returns 0 on success or an error 
11 * code on failure. Note that we do not set errno if we 
12 * encounter an error. 

13 x 

14 * LOCKING: none. 

15 */ 

16 int 

17 getaddrlist (const char *host, const char *service, 
18 struct addrinfo **ailistpp) 

19 { 

20 int err; 

21 struct addrinfo hint; 

22 hint.ai_flags = AI_CANONNAME; 

23 hint.ai_family = AF_INET; 

24 hint.ai_socktype = SOCK_STREAM; 

25 hint.ai protocol = 0; 

26 hint.ai_addrlen = 0; 

27 hint.ai_canonname = NULL; 

28 hint.ai_addr = NULL; 

29 hint.ai_next = NULL; 

30 err = getaddrinfo(host, service, &hint, ailistpp); 
31 return (err); 

32 } 

[1-7] 首先 定义 了 这 个 文件 中 的 函数 所 需 的 限制 。MAXCFGLINE 是 打印 机 配置 文件 中 
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[8-32] 


33 /* 
34 * 
35 * 
36 * 
37 * 


38 */ 


行 的 最 大 长 度 ，MAXKWLEN 是 配置 文件 中 关键 字 的 最 大 尺寸 ，MAXFMTLEN 是 传 
给 sscanf 的 格式 化 字符 串 的 最 大 长 度 。 

第 一 个 函数 是 getadar1ist， 它 是 getaddrinfo (16.3.3 节 ) 的 封装 ， 因 为 
常常 用 同样 的 结构 来 调用 getaddrinfo。 注 意 在 这 个 函数 中 不 需要 用 互 斥 锁 。 
每 个 函数 前 面 的 LOCKING 注 释 只 为 用 于 多 线程 锁定 的 文档 编写 。 这 一 注释 列 出 
了 可 能 有 的 关于 锁 的 假设 ， 告 知 该 函数 所 需要 获得 或 释放 的 锁 ， 并 告知 调用 者 
这 个 函数 所 需要 持 有 的 锁 。 


Given a keyword, scan the configuration file for a match 
and return the string value corresponding to the keyword. 


LOCKING: none. 


39 static char * 
40 scan_configfile(char *keyword) 





41 { 

42 int n, match; 

43 FILE *fp; 

44 char keybuf [MAXKWLEN], pattern [MAXFMTLEN] ; 

45 char line [MAXCFGLINE] ; 

46 static char valbuf [MAXCFGLINE] ; 

47 if ((fp = fopen(CONFIG_FILE, "r")) == NULL) 

48 log sys("can't open ts", CONFIG FILE); 

49 sprintf (pattern, "$&$&ds %%%ds", MAXKWLEN-1, MAXCFGLINE-1); 
50 match = 0; 

51 while (fgets(line, MAXCFGLINE, fp) !- NULL) { 

52 n = sscanf(line, pattern, keybuf, valbuf); 

53 if (n == 2 && stremp(keyword, keybuf) == 0) { 

54 match = 1; 

55 break; 

56 

57 } 

58 fclose (fp); 

59 if (match != 0) 

60 return (valbuf) ; 

61 else 

62 return (NULL) ; 

63  ) 

[33-46] ”scan_configfile 函 数 在 打印 机 配置 文件 中 搜索 指定 的 关键 字 。 
[47-63] ”以 读 方式 打开 配置 文件 ， 根 据 搜索 模式 建立 格式 字符 申 。 符 号 8%$%as 建 立 一 个 


格式 指示 器 来 限定 字符 串 尺 寸 ， 这 样 就 不 会 溢出 用 于 在 堆栈 中 存放 字符 串 的 缓 
冲 区 。 在 文件 中 一 次 读 取 一 行 ， 搜 索 用 空格 符 分 开 的 两 个 字符 申 ， 如 果 找 到 这 
样 的 字符 串 ， 就 用 关键 字 比 较 第 一 个 字符 串 。 如 果 找 到 一 个 匹配 或 者 读 取 到 文 
件 尾 ， 则 循环 结束 并 关闭 文件 。 当 关键 字 匹 配 时 ， 返 回 一 个 指针 指向 包含 关键 
字 后 面 的 字符 串 的 缓冲 区 ， 否 则 ， 返 回 NULEL。 

返回 的 字符 串 存 放 在 一 个 静态 缓冲 区 (valbuf) ， 该 缓冲 区 会 被 紧 接着 的 调用 
覆盖 。 因 此 ，scan_configfile 不 能 用 于 多 线程 程序 ， 除 非 小 心地 避免 同时 
有 多 个 线程 调用 它 。 
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64 /* 

65 * Return the host name running the print server or NULL on error. 

66 * 

67 * LOCKING: none. 

68 */ 

69 char * 

70 get printserver (void) 

71 { 

72 returní(scan configfile("printserver")); 

73 } 

74 /* 

75 * Return the address of the network printer or NULL on error. 

76 * 

77 * LOCKING: none. 

78 */ 

79 struct addrinfo * 

80 get_printaddr (void) 

81 { 

82 int err; 

83 char *p; 

84 struct addrinfo *ailist; 

85 if ((p = scan configfile("printer")) !- NULL) { 

86 if ((err = getaddrlist(p, "ipp", &ailist)) != 0) { 

87 log msg("no address information for ts", p); 

88 return(NULL); 

89 

90 return(ailist); 

91 } 

92 log_msg("no printer address specified") ; 

93 return (NULL) ; 

94 } 

[64-73] get_printserver 仅 仅 是 一 个 函数 封装 器 ， 它 调用 scan_configfile 来 找 
到 运行 打印 假 脱 机 守护 进程 的 计算 机 系统 名 字 。 

[74-94] ”使 用 get_printaddr 函 数 来 获取 网 络 打 印 机 的 地 址 。 该 函数 和 前 面 的 函数 很 
像 ， 除 了 当 找 到 配置 文件 中 的 打印 机 名 字 时 用 名 字 来 查找 相应 的 网 络 地 址 。 
get_printserver 和 get_printadar 均 调用 scan_configfile。 如 果 不 
能 打开 打印 机 配置 文件 ，scan_configfil1e 就 调用 log_sys 打 印 出 错 信息 并 退 
出 。 尽 管 get_printserver 想 要 由 客户 端 命令 调用 ， 而 get_printadar 想 
要 由 守护 进程 程序 调用 ， 两 者 均 可 调用 1og_sys ， 因 为 通过 设置 一 个 全 局 变量 
可 以 安排 日 志 函 数 将 其 打印 到 标准 错误 ， 而 不 是 输出 到 日 志文 件 。 

95 /* 

96 * "Timed" read - timout specifies the # of seconds to wait before 

97 * giving up (5th argument to select controls how long to wait for 

98 * data to be readable). Returns # of bytes read or -1 on error. 

99 * 

100 * LOCKING: none. 

101 */ 

102  ssize t 

103 tread(int fd, void *buf, size t nbytes, unsigned int timout) 

104 { 

105 int nfds; 

106 fd set readfds; 
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107 struct timeval tv; 

108 tv.tv_sec = timout; 

109 tv.tv_usec = 0; 

110 FD ZERO(&readfds); 

111 FD SET(fd, &readfds); 

112 nfds = select(fd«1, &readfds, NULL, NULL, &tv); 

113 if (nfds <= 0) { 

114 if (nfds == 0) 

115 errno = ETIME; 

116 return(-1); 

117 

118 return(read(fd, buf, nbytes)); 

119 

[95-107] 我 们 提供 叫 作 treaa 的 函数 来 读 取 指定 的 字 节 数 ， 在 放弃 以 前 至 多 阻塞 fimout 
秒 。 当 我 们 从 一 个 套 接 字 或 一 个 管道 读数 据 时 这 个 函数 很 有 用 。 如 果 在 指定 的 
时 间 期 限 内 没有 接受 数据 ， 返 回 一 1 并 将 errno 设 为 ETIME。 如 果 在 时 间 期 限 内 
有 数据 可 用 ， 返 回 最 多 nbytes 字 节 的 数据 ， 但 是 如 果 数 据 没 有 及 时 到 达 ， 我 们 可 
以 返回 比 要 求 的 要 少 。 
我 们 将 使 用 tread 在 打印 假 脱 机 守护 进程 上 预防 拒绝 服务 攻击 。 一 个 恶意 用 户 
可 能 重复 尝试 连接 到 守护 进程 而 不 发 送 数据 ， 不 让 其 他 用 户 能 够 提交 打印 作业 。 
通过 一 个 合理 时 间 内 放弃 的 方式 ， 我 们 防止 这 种 情况 发 生 。 其 巧妙 之 处 在 于 选 
择 一 个 合理 的 超时 值 ， 当 系统 负载 比较 低 和 任务 花费 更 长 时 间 时 ， 该 值 足够 大 
能 够 防止 过 早 天 折 。 但 是 ， 如 果 我 们 选择 的 值 太 大 ， 通 过 允许 守护 进程 消耗 太 
多 资源 去 处 理 挂 起 请 求 ， 可 能 导致 拒绝 服务 攻击 。 

[108-119] 使 用 select 等 待 指 定 的 文件 描述 符 可 读 。 如 果 在 要 读 取 的 数据 可 用 之 前 超时 ， 
select 返 回 0， 这 种 情况 将 errno 设 为 BTIME。 如 果 select 失 败 或 超时 ， 返 
回 一 1， 否则 ， 返回 任何 可 用 数据 。 

120  /* 

121 * "Timed" read - timout specifies the number of seconds to wait 

122 * per read call before giving up, but read exactly nbytes bytes. 

123 * Returns number of bytes read or -1 on error. 

2 * 

i2 * LOCKING: none. 

126 aya 

127 ssize_t 

128 treadn(int fd, void *buf, size t nbytes, unsigned int timout) 

or size t nleft; 

131 ssize_t nread; 

132 nleft - nbytes; 

133 while (nleft > 0) { 

134 if ((nread = tread(fd, buf, nleft, timout)) « 0) { 

135 if (nleft == nbytes) 

136 return(-1); /* error, return -1 */ 

137 else 

138 break; /* error, return amount read so far */ 

139 } eise if (nread == 0) { 

140 break; /* BOF */ 

141 } 
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nleft -= nread; 
buf += nread; 


return (nbytes - nleft); /* return >= 0 */ 





[120-146] 还 提供 了 treaq 的 变 体 ， 叫 做 Ereadn， 它 只 正好 读 取 请 求 的 字 节 数 。 这 和 14.8 


节 中 描述 的 reaqn 函数 类 似 ， 只 是 增加 了 一 个 超时 参数 。 

为 了 正好 读 取 nbytes 字 节 ， 必 须 准 备 进行 多 次 read 调 用 。 其 困难 之 处 在 于 尝试 
将 单个 超时 值 应 用 到 多 个 reaq 调 用 。 这 里 不 想 用 益 钟 ， 因 为 在 多 线程 应 用 中 信 
号 会 变 乱 ， 也 不 能 依赖 系统 根据 select 的 返回 的 更 新 过 的 timeval 结 构 ， 以 
指示 剩余 的 时 间 ， 因 为 许多 平台 不 支持 这 个 (14.5.1 节 )。 因 此 ， 这 种 情况 需要 
折 中 并 定义 一 个 超时 值 应 用 到 单独 的 read 调 用 。 代 替 限 制 等 待 时 间 的 总 量 ， 它 
限制 循环 中 每 次 迭代 的 等 待 时间 。 总 等 待 的 最 大 时 间 由 (nbytes x timout) 秒 限 
E (最 坏 的 情况 ， 一 次 仅 收 到 一 个 字 节 )。 

使 用 nieft 来 记录 要 读 取 的 剩余 字 节 数 。 如 果 tread 失 败 并 在 上 一 次 迭代 中 已 经 
接收 到 数据 ， 则 停止 while 循 环 并 返回 读 取 的 字 节 数 ， 否 则 返回 -1。 


接 下 来 是 用 于 提交 打印 作业 的 命令 程序 ， 它 的 C 源 文件 是 print .c。 


iQ: 0 - NAM PW dH HÀ 





/* 
* The client command for printing documents. Opens the file 
* and sends it to the printer spooling daemon. Usage: 
* print [-t] filename 
*/ 
#include "apue.h" 
#include "print.h" 
#include «fcntl.h» 
#include <pwd.h> 


/* 
* Needed for logging funtions. 
*/ 

int log to stderr = 1; 


void submit file(int, int, const char *, Size t, int); 


int 
main(int argc, char *argv[]) 


int fd, sockfd, err, text, c; 
Struct stat sbuf; 
char *host ; 


struct addrinfo *ailist, *aip; 


err = 0; 
text = 0; 
while ((c = getopt(argc, argv, "t")) |= -1) { 
switch (c) { 
case ‘t’: 
text = 1; 
break; 


case '?': 
err - 1; 
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break; 


需要 定义 一 个 名 为 1og_to_stderr 的 整数 ， 通 过 这 个 整数 能 够 使 用 函数 库 中 
的 日 志 函 数 。 如 果 该 整数 设 为 非 零 值 ， 错 误 消息 将 被 送 到 标准 错误 输出 来 取代 
日 志文 件 。 尽 管 在 print .c 中 没有 使 用 任何 日 志 函 数 ， 但 确实 将 util .o 链 接 
到 print .o 来 构建 可 执行 的 print 命 令 ， 并 且 util.c 包 含 用 于 用 户 命令 行程 
序 和 守护 进程 的 函数 。 

支持 一 个 选项 ，-t， 强 迫 文件 按照 文本 格式 打印 (而 不 是 其 他 格式 ， 例 如 
PostScript 格 式 ) 。 使 用 getopt(3) 函 数 来 处 理 命令 选项 。 


if (err || (optind != argc - 1)) 
err quit("usage: print [-t] filename"); 
if ((fd = open(argv[optind], O RDONLY)) < 0) 
err sys("print: can't open ts", argv[1]); 
if (fstat(fd, &sbuf) « 0) 
err sys("print: can't stat %s", argv[11); 
if (!S ISREG(sbuf.st mode)) 
err quit("print: %s must be a regular file\n", argv[11); 


/* 


* Get the hostname of the host acting as the print server. 
* 


if ((host = get printserver()) == NULL) 
err quit("print: no print server defined"); 
if ((err = getaddrlist(host, "print", &ailist)) = 0) 


err quit("print: getaddrinfo error: $s", gai strerror(err)); 


for (aip = ailist; aip != NULL; aip = aip-»ai next) { 
if ((sockfd = socket(AF INET, SOCK STREAM, 0)) < 0) { 
err - errno; 
) else if (connect retry(sockfd, aip-»ai addr, 
aip-»ai addrlen) « 0) { 
err = errno; 


当 getopt 处 理 完 命令 选项 时 ,将 变量 cptinq 设 为 指向 第 一 个 非 选项 参数 下 标 。 
如 果 该 值 不 是 最 后 一 个 参数 的 下 标 ， 那 么 指定 了 错误 的 参数 个 数 (只 支持 一 个 
非 选 项 参数 ) 。 错 误 处 理 包括 : 检查 是 否 能 够 打开 要 打印 的 文件 ， 检 查 是 否 是 一 
个 常规 文件 (而 不 是 一 个 目录 或 者 其 他 类 型 的 文件 )。 

通过 调用 util.c 中 的 get._printserver 函 数 ， 取 得 打印 假 脱 机 守护 进程 的 名 
字 ， 然 后 调用 getaddr1ist (也 在 util.c 中 ) 将 主机 名 字 转 换 成 网 络 地 址 。 
注意 : 指定 服务 名 字 为 “print" 。 在 系统 上 安装 打印 假 脱 机 守护 进程 时 ， 需 要 确 
保 /etc/services (或 等 价 的 数据 库 ) 有 打印 机 服务 的 条 目 。 当 为 守护 进程 
程序 选择 端口 时 ， 最 好 选择 特权 端口 ， 以 防止 恶意 用 户 程序 假装 成 一 个 打印 假 
脱 机 守护 进程 ， 而 实际 上 是 要 偷 取 打印 文件 的 副本 。 这 意味 着 端口 号 应 小 于 1 024 
(回忆 16.3.4 节 )， 并 且 守 护 进程 程序 运行 时 必须 具有 超级 用 户 特权 以 便 能 够 绑 定 
一 个 保留 端口 。 

从 由 getaddarinfo 返 回 的 地 址 列表 中 ， 一 次 使 用 一 个 地 址 来 尝试 连接 到 守护 
进程 程序 ， 然 后 使 用 能 够 连接 的 第 一 个 地 址 来 发 送 文件 到 守护 进程 程序 。 
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55 } else { 

56 submit file(fd, sockfd, argv[1], sbuf.st size, text); 

57 exit(0); 

58 

59 ] 

60 errno - err; 

61 err ret("print: can't contact %s", host); 

62 exit(1); 

63 ) 

64 /* 

65 * Send a file to the printer daemon. 

66 */ 

67 void 

68 submit file(int fd, int sockfd, const char *fname, size t nbytes, 

69 int text) 

70 ( 

71 int nr, nw, len; 

72 Struct passwd *pwd; 

73 struct printreq req; 

74 struct printresp res; 

75 char buf [IOBUFSZ]; 

76 /* 

77 * First build the header. 

78 */ 

79 if ((pwd = getpwuid(geteuid())) == NULL) 

80 strcpy(req.usernm, "unknown") ; 

81 else 

82 strepy(req.usernm, pwd-»pw name); 

83 req.size = htonl(nbytes); 

84 if (text) 

85 req.flags = htonl(PR TEXT); 

86 else 

87 req.flags - 0; 

[55-63] — 如 果 能 够 建立 一 个 连接 ， 调 用 submit_file 将 文件 传送 到 打印 假 脱 机 守护 进 
程 ， 如 果 不 能 连接 到 任何 地 址 ， 则 打印 错误 消息 并 退出 。 这 里 使 用 err_ret 和 
exit 代 替 单 一 调用 err_sys 以 避免 编译 警告 ， 因 为 如 果 单独 调用 err_sys， 
main 的 最 后 一 行 就 不 是 return 语 句 或 exit 调 用 了 ， 从 而 产生 编译 警告 。 

[64-87] submit_file 发 送 打 印 请 求 到 守护 进程 程序 并 读 取 响 应 消息 。 首 先 ， 建 立 
printreqg 请 求 首 部 。 使 用 geteuid 来 获得 调用 者 的 有 效用 户 ID 并 将 其 传 给 
getpwuid 以 便 在 系统 密码 文件 中 查找 用 户 ， 复 制 这 个 用 户 名 到 请 求 首部 ， 或 
者 ， 如 果 不 能 标识 用 户 ， 则 使 用 字符 种“unknown”。 将 要 打印 的 文件 转 成 网 
络 字 节 序 后 ， 把 其 文件 长 度 保存 在 请 求 首部 。 如 果 文件 按 纯 文本 格式 打印 ,在 
请 求 首部 保存 PR_TEXT 标 志 。 

88 if ((len = strlen(fname)) >= JOBNM MAX) { 

89 /* 

90 * Truncate the filename (+-5 accounts for the leading 

91 * four characters and the terminating null). 

92 */ 

93 strepy(req.jobnm, "... "); 

94 strncat (req.jobnm, &fname [len-JOBNM_MAX+5], JOBNM_MAX-5) ; 

95 } else { 
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96 strepy(req.jobnm, fname); 

97 

98 /* 

99 * Send the header to the server. 

100 */ 

101 nw - writen(sockfd, &req, sizeof(struct printreq)); 
102 if (nw != sizeof(struct printreq)) { 

103 if (nw « 0) 

104 err syS("can't write to print server"); 

105 else 

106 err quit ("short write (%d/%d) to print server", 
107 nw, Sizeof(struct printreq)); 

108 ) 

109 /* 

110 * Now send the file. 

111 */ 

112 while ((nr = read(fd, buf, IOBUFSZ)) != 0) { 

113 nw = writen(sockfd, buf, nr); 

114 if (nw != nr) { 

115 if (nw < 0) 

116 err_sys("“can’t write to print server"); 
117 else 

118 err_quit ("short write (%d/%td) to print server", 
119 nw, nr); 

120 } 

121 } 


[88-108] “将 作业 名 设 为 要 打印 的 文件 名 ， 如 果 名 字 长 度 超出 了 报 文 所 能 容纳 的 长 度 ， 则 


i] 





将 名 字 的 开头 部 分 截 去 ， 并 代入 省 略 符 ， 以 表示 该 字段 还 有 更 多 的 字符 。 然 后 
使 用 writen 将 请 求 首 部 发 送 到 守护 进程 程序 ， 如 果 写 人 失败 或 者 传送 的 数据 
少 于 期 望 的 数据 ， 将 打印 错误 消息 然后 退出 。 

[109-121] 在 发 送 请 求 首部 给 守护 进程 程序 之 后 ， 发 送 要 打印 的 文件 。 一 次 读 取 文 件 中 
IOBUFSZ 字 节 然 后 使 用 writen 将 数据 发 送 给 守护 进程 程序 。 和 请 求 首部 一 样 ， 
如 果 写 入 失败 或 者 写 入 的 数据 少 于 期 望 的 数据 ， 将 打印 错误 消息 然后 退出 。 


122 /* 


123 * Read the response. 

124 */ 

125 if ((nr = readn(sockfd, &res, sizeof(struct printresp))) != 
126 sizeof (struct printresp)) 

127 err Sys("can't read response from server"); 
128 if (res.retcode != 0) { 

129 printf ("rejected: %s\n", res.msg) ; 

130 exit (1); 

131 } else { 

132 printf ("job ID %ld\n", ntohl(res.jobid)); 
133 

134 exit (0); 

135} 


[122-135] 当 把 要 打印 的 文件 送 给 守护 进程 后 ， 读 取 守 护 进程 的 响应 。 如 果 请 求 失败 ， 返 
回 码 (retcode) 为 非 零 值 ， 并 且 将 响应 中 的 文本 形式 的 错误 信息 打印 出 来 。 
如 果 请 求 成 功 ， 我 们 打印 作业 ID ， 以 便 用 户 以 后 以 此 引用 该 请 求 。( 将 写 一 个 命 
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令 来 取消 一 个 打印 请 求 作 为 一 个 练习 ， 作 业 ID 可 以 用 于 取消 作业 请 求 ， 共 作用 
是 从 打印 队列 中 识别 要 删除 的 作业 。) 
注意 ， 一 个 成 功 的 从 守护 进程 来 的 响应 并 不 意味 着 打印 机 可 以 打印 该 文件 ， 仅 
仅 意味 着 守护 进程 成 功 地 将 其 加 入 到 打印 作业 队列 。 
print.c 中 的 大 部 分 内 容 已 经 在 前 面 的 章节 中 讨论 过 了 。 唯 一 没有 涉及 的 主题 是 getopt 
函数 ， 尽 管 在 第 19 章 的 pty 程 序 中 已 经 见 到 过 该 函数 。 
同一 个 系统 中 的 所 有 命令 遵循 同样 的 使 用 惯例 是 很 重要 的 ， 因 为 这 样 更 易于 使 用 。 如 果 用 户 
比较 熟悉 一 个 命令 程序 中 命令 行 选项 的 安排 在 操作 遵循 其 他 使 用 惯例 的 命令 时 ， 比 较 容易 出 错 。 
当 处 理 命令 行 中 的 空格 时 这 种 问题 就 会 浮现 。 一 些 命令 要 求 选项 与 其 参数 用 空格 分 开 ， 但 
是 另外 一 些 命令 要 求 参 数 紧 随 其 选项 之 后 ， 中 间 没 有 任何 空白 。 如 果 没 有 一 套 统一 的 规则 ， 用 
户 要 么 必须 记 住所 有 命令 的 语法 ， 要 么 就 是 不 得 不 在 调用 命令 时 反复 试验 、 不 断 摸索 。 
Single UNIX Specification 包 含 一 套 惯 例 和 准则 来 给 出 一 致 的 命令 行 语法 ， 里 面包 括 的 建议 
如 “将 每 个 命令 行 选项 限制 为 一 个 字母 数字 字符 ”和 “所 有 的 选项 必须 以 一 字符 为 前 导 ”。 
幸运 的 是 ， 存 在 getopt 函数 帮助 命令 开发 者 按照 一 致 的 方式 来 处 理 命令 行 选项 。 


#include <fcntl.h> 


int getopt (int argc, const * const argv[], const char *options); 


extern int optind, opterr, optopt; 
extern char *optarg; 





返回 值 : 下 一 个 选项 字符 ， 若 全 部 选项 处 理 完毕 则 返回 -1 


参数 argc 和 arsg* 与 传 给 main 函 数 的 相同 。 参 数 options 是 包含 命令 支持 的 选项 字符 的 字符 串 。 如 
果 一 个 选项 字符 后 面 跟着 一 个 冒号 ， 那 么 选项 带 一 个 参数 ， 否 则 ， 只 有 选项 本 身 。 例 如 ， 如 果 
一 个 命令 的 用 法 如 下 : 

command [-i] [-u username] [-z] filename 
则 “iu:z” 将 作为 opfions 字 符 串 传人 到 getopt。 

getopt 的 通常 用 法 是 一 个 循环 ， 当 getopt 返 回 ~1 时 结束 循环 。 在 每 次 循环 中 ，getopt 
会 返回 下 一 个 处 理 的 选项 。 由 应 用 程序 来 处 理 选 项 中 的 冲突 ， 实 际 上 ，getopt 仅 仅 简单 地 分 
析 命 令 选项 并 强制 执行 选项 的 标准 格式 而 已 。 

当 遇 到 一 个 不 合法 的 选项 时 ，getopt 返 回 一 个 问号 而 不 是 一 个 字符 。 如 果 选 项 的 参数 缺 
失 ，getopt 也 会 返回 一 个 问号 ,但 是 如 果 选 项 字符 申 中 第 一 个 字符 是 冒号 ，getopt 会 返回 一 
个 冒号 。 特 殊 模式 - -会 让 getopt 停 止 处 理 并 返回 -1。 这 可 以 让 用 户 提供 一 个 以 负 号 开头 的 命 
令 参数 而 非 选 项 。 例 如 ， 如 果 有 一 个 文件 名 为 -par， 则 不 可 以 通过 输入 下 列 命令 来 删除 之 。 

rm -bar 
因为 rm 会 尝试 将 -bar 解 释 成 选项 。 可 以 用 下 列 方式 来 删除 文件 : 

rm -- -bar 

getopt 函 数 支持 四 个 外 部 变量 : 

optarg ”如果 选项 带 有 参数 ， 处 理 该 选项 时 ，getopt 将 optarg 指 向 该 选项 的 参数 字符 申 。 

opterr “如果 遇 到 一 个 选项 错误 ，getopt 软 认 动 作 是 会 打印 一 个 错误 消息 。 为 了 禁止 

该 行为 ， 应 用 程序 可 以 将 opterr 设 为 0。 


bbs.theithome.com 











774 


620 第 21 章 “与 网 络 打印 机 通信 


optind 不 一 个 要 处 理 的 字符 串 的 argv 数 组 的 下 标 。 该 下 标 从 1 开始 ， 每 个 参数 被 
getopt 处 理 后 增 量 。 

optopt 如果 在 处 理 选 项 过 程 中 过 到 错误 ，getopt 将 optopt 指 向 引起 错误 的 选项 字符 申 。 

最 后 一 个 要 考查 的 C 源 文件 是 打印 假 脱 机 守护 进程 程序 。 


/* 
* Print server daemon. 
*/ 
#include "apue.h" 
#include "print.h" 
#include "ipp.h" 
#include «fcntl.h» 
#include «dirent.h» 
9 #include <ctype.h> 
10 #include <pwd.h> 
11 #include <pthread.h> 
12 #include <strings.h> 
13 #include «sys/select.h» 
14 #include <sys/uio.h> 





QD -J Ov Ui i UJ IN FP 


15 /* 

16 * These are for the HTTP response from the printer. 
17 */ 

18 #define HTTP_INFO (x) ((x) >= 100 && (x) <= 199) 

19 #define HTTP SUCCESS(x) ((x) >= 200 && (x) <= 299) 

20 /* 

21 * Describes a print job. 

22 */ 

23 struct job { 

24 struct job *next ; /* next in list */ 

25 struct job *prev; /* previous in list */ 
26 long jobid; /* job ID */ 

27 struct printreq req; /* copy of print request */ 
28}; 

29  /* 

30 * Describes a thread processing a client request. 

31 */ 

32 struct worker thread { 

33 struct worker thread  *next; /* next in list */ 
34 struct worker thread  *prev; /* previous in list */ 
35 pthread t tid; /* thread ID */ 

36 int sockfd; /* socket */ 

37 ) 


[1-19] 打印 假 脱 机 守护 进程 程序 包含 前 面 看 到 的 IPP 头 文件 ， 因 为 守护 进程 程序 需要 和 
采用 这 个 协议 的 打印 机 通信 。 HTTP_INFO 和 HTTP_SUCCESS 宏 定义 了 HTTP 请 
求 的 状态 (IPP 建 立 在 HTTP 之 上 )。 

[20-37] ” 假 脱 机 守护 进程 程序 使 用 job 和 worker_thread 结 构 来 跟踪 相应 的 打印 作业 


和 接受 打印 请 求 的 线程 。 
ee 
38 /* 
39 * Needed for logging. 
40 */ 
41 int log to stderr - 0; 
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42 /* 

43 * Printer-related stuff. 

44 */ 

45 struct addrinfo *printer; 

46 char *printer_name; 

47 pthread_mutex_t configlock = PTHREAD_MUTEX_INITIALIZER; 

48 int reread; 

49 /* 

50 * Thread-related stuff. 

51 */ 

52 struct worker thread *workers; 

53 pthread mutex t workerlock - PTHREAD MUTEX INITIALIZER; 

54 sigset t mask; 

55 /* 

56 * Job-related stuff. 

57 */ 

58 struct job *jobhead, *jobtail; 

59 int jobfd; 

[38-41] 日 志 函数 需要 定义 1og_to_stderr 变 量 ， 并 且 将 其 设 为 0， 以 使 得 日 志 消 息 发 
送 到 系统 日 志 而 不 是 标准 错误 输出 。 在 print .c 中 ， 即 使 在 用 户 命令 中 不 使 用 
日 志 函 数 ， 也 设置 10g_to_stderr 为 1。 如 果 将 工具 函数 拆 分 为 两 个 单独 的 文 
fb; 一 个 用 于 服务 器 ， 另 一 个 用 于 客户 端 命令 ， 则 可 以 避免 这 种 情况 。 

[42-48] ”使 用 全 局 变量 printer 来 保存 打印 机 的 网 络 地 址 。 在 printer_name 中 保存 打 
印 机 的 主机 名 字 。configlock 互 尺 量 用 于 保护 对 Keread 变 量 的 访问 ， 该 变 
量 用 于 表示 守护 进程 程序 需要 再 次 读 取 配 置 文件 ， 原 因 可 能 是 管理 员 改 变 了 打 
印 机 或 打印 机 的 网 络 地 址 。 

[49-54] ” 接 下 来 定义 与 线程 相关 的 变量 。 使 用 workers 作 为 线程 的 双向 链表 的 头 部 ， 该 
表 用 于 接受 来 自 客 户 端的 文件 。 采 用 worker1lock 互 斥 量 来 保护 该 表 。 变 量 
mask 用 于 线程 的 信号 掩 码 。 

[55-59] ”对 于 挂 起 作业 的 链表 ， 定 义 jobhead 为 表 头 ，jobtail 为 表 尾 。 该 表 也 是 双向 
链接 的 ， 但 是 需要 将 作业 加 入 到 表 尾 ， 所 以 需要 一 个 指针 来 记 住 表 尾 。 至 于 表 
中 的 工作 者 线程 ， 次 序 则 是 无 关 紧要 的 ， 因 此 可 以 将 他 们 加 入 到 表 头 部 而 不 需 
要 记 住 表 尾 指针 。jobfda 是 作业 文件 的 文件 描述 符 。 

60 long nextjob; 

61 pthread_mutex_t joblock = PTHREAD MUTEX INITIALIZER; 

62 pthread cond t jobwait - PTHREAD COND INITIALIZER; 

63 /* 

64 * Function prototypes. 

65 */ 

66 void init request(void); 

67 void init printer(void); 

68 void update jobno (void); 

69 long get newjobno (void) ; 

70 void add job(struct printreq *, long); 

71 void replace job(struct job *); 

72 void remove job(struct job *); 

73 void build qonstart (void); 

74 void *client thread(void *); 

75 | void *printer thread(void *); 
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76 voi 
77 ssi 
78 int 
79 voi 
80 voi 
81 voi 
82 /* 

83 * 


84 * 
85 * 
86 * 
87 x/ 
88 int 
89 mai 
90 ( 
91 

92 

93 

94 

95 

96 

97 


[60-62] 


(63-81] 


[82-97] 


98 
99 
100 


101 
102 
103 
104 
105 
106 
107 
108 
109 
110 
111 
112 


d *signal thread(void *); 
ze t readmore(int, char **, int, int *); 
printer status(int, struct job *); 
d add worker(pthread t, int); 
d kill workers (void); 
d client cleanup(void *); 
Main print server thread. Accepts connect requests from 


clients and spawns additional threads to service requests. 


LOCKING: none. 


n(int argc, char *argv[]) 

pthread t tid; 

struct addrinfo *ailist, *aip; 

int SOCkfd, err, i, n, maxfd; 
char *host; 

fd set rendezvous, rset; 

struct sigaction sa; 

struct passwd *pwdp; 


nextjob 是 接收 的 下 一 个 打印 作业 的 ID。 互 斥 量 jcblock 保 护 作 业 链 表 ， 同 时 
还 有 条 件 变量 jobwait 代 表 的 条 件 。 

声明 本 文件 中 所 有 余下 的 函数 的 原型 。 把 这 些 工 作 做 在 前 面 可 以 使 得 在 文件 中 
放置 函数 时 不 用 担心 函数 调用 的 次 序 。 

打印 假 脱 机 守护 进程 程序 的 main 函 数 执行 两 个 任务 : 初始 化 守护 进程 程序 然后 
处 理 来 自 客 户 端的 连接 请 求 。 


if (arge != 1) 
err quit ("usage: printd"); 
daemonize ("printd") ; 


sigemptyset (&sa.sa_mask) ; 

sa.sa flags = 0; 

sa.sa_handler = SIG IGN; 

if (sigaction(SIGPIPE, &sa, NULL) « 0) 
log_sys("sigaction failed"); 

sigemptyset (&mask) ; 

sigaddset (&mask, SIGHUP); 

sigaddset (&mask, SIGTERM) ; 

if ((err = pthread sigmask(SIG BLOCK, &mask, NULL)) != 0) 
log sysí("pthread sigmask failed"); 

init request(); 

init printer(); 


113 #ifdef SC HOST NAME MAX 


114 
115 


n - sysconf( SC HOST NAME MAX); 
if (n < 0) /* best guess */ 


116 #endif 


117 


118 
119 
120 
121 


n = HOST NAME MAX; 


if ((host = malloc(n)) == NULL) 
log sys("malloc error"); 

if (gethostname (host, n) < 0) 
log sys("gethostname error"); 
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[98-100] ”守护 进程 程序 没有 任何 选项 ， 所 以 如 果 argc 不 为 1， 调用 err_quit 打 印 错误 
消息 然后 退出 。 调 用 程序 清单 13-1 中 的 daemonize 函 数 成 为 一 个 守护 进程 。 在 
此 之 后 ， 不 能 在 标准 错误 上 打印 错误 消息 ， 取 而 代 之 的 是 对 其 记录 日 志 。 

[101-112] 调整 为 忽略 SIGPIPE。 将 要 写 套 接 字 文件 描述 符 ， 并 且 不 想 让 写 错误 触发 
SIGPIPE， 因 为 其 默认 动作 是 杀 死 进程 。 下 一 步 ， 设 置 线程 的 信号 掩 码 ， 包 括 
SIGHUP 和 SIGTERM。 创 建 的 所 有 线程 均 继承 这 个 信号 掩 码 。 使 用 SIGHUP 来 告 
诉 守护 进程 程序 再 次 读 取 配置 文件 ，SIGTERM 来 告诉 守护 进程 程序 执行 清理 工 
作 并 优雅 地 退出 。 调 用 init_request 初 始 化 作业 请 求 并 确保 只 有 一 个 守护 进 
程 的 副本 在 运行 ， 调 用 init_printer 来 初始 化 打印 机 信息 (马上 可 以 看 到 这 
些 函数 )。 

[113-121] 如 果 平 台 定 义 了 _SC_HOST_NAME_MAX 符 号 ， 调 用 sysconf 来 获取 主机 名 字 的 
最 大 长 度 。 如 果 sysconf 失 败 或 者 没有 定义 该 限制 ， 就 采用 HOST_NAME_MAX 
作为 最 佳 选择 。 有 了 时， 平台 已 对 此 作 了 定义 ,但 是 如 果 没 有 ， 则 在 print .h 中 
选择 值 。 分 配 内 存 来 保存 主机 名 字 并 调用 gethostname 来 获取 。 

122 if ((err = getaddrlist(host, "print", &ailist)) != 0) { 

123 log quit("getaddrinfo error: $s", gai strerror(err)); 

124 exit(1); 

125 

126 FD ZERO (&rendezvous) ; 

127 maxfd = -1; 

128 for (aip = ailist; aip !- NULL; aip = aip-»ai next) { 

129 if ((sockfd = initserver(SOCK STREAM, aip-»ai addr, 

130 aip-»ai addrlen, QLEN)) >= 0) { 

131 FD SET(sockfd, &rendezvous); 

132 if (sockfd » maxfd) 

133 maxfd - sockfd; 

134 ) 

135 

136 if (maxfd == -1) 

137 log quit("service not enabled"); 

138 pwdp = getpwnam("lp"); 

139 if (pwdp == NULL) 

140 log sysí("can't find user lp"); 

141 if (pwdp-»pw uid == 0) 

142 log quit("user lp is privileged"); 

143 if (setuid(pwdp-»pw uid) < 0) 

144 log sysí("can't change IDs to user lp"); 

[122-135] 接 下 来 ， 尝 试 找到 守护 进程 程序 用 以 提供 打印 假 脱 机 服务 的 网 络 地 址 。 清 零 
rendezvous fd_set 变 量 ,该 变量 将 与 select 一 起 用 来 等 待 客户 端 连 接 请 求 。 
将 最 大 文件 描述 符 初始 化 为 1， 以 确保 所 分 配 的 第 一 个 文件 描述 符 大 于 maxfd。 
对 于 每 个 需要 提供 服务 的 网 络 地 址 ， 调 用 initserver ( 见 程序 清单 16-9) 来 
分 配 和 初始 化 套 接 字 。 如 果 initserver 成 功 ， 将 其 文件 描述 符 加 入 fq_set， 
如 果 该 描述 符 大 于 现 有 最 大 值 maxfd， 将 naxfd 设 为 该 描述 符 值 。 

[136-137] 当 走 完整 个 addrinfo 结 构 列 表 后 ， 如 果 maxfd 仍 为 -1， 不 能 启动 打印 假 脱 机 
服务 ， 记 录 日 志 然 后 退出 。 

[138-144] 守护 进程 程序 需要 超级 用 户 特权 来 绑 定 套 接 字 到 保留 端口 。 完 成 绑 定 后 ， 通 过 
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145 
146 
147 


148 


149 
150 
151 
152 
153 
154 


155 
156 
157 
158 
159 
160 
161 
162 
163 
164 
165 
166 
167 
168} 


[145-148] 


[149-168] 


将 用 户 ID 改变 到 用 户 1P (回忆 21.4 节 的 安全 方面 的 讨论 ) 降低 读 程 序 特权 。 这 
里 想 遵 循 最 小 特权 原则 ， 以 避免 在 守护 进程 程序 中 将 系统 暴露 给 任何 可 能 的 攻 
击 。 调 用 getpwnam 来 找到 与 用 户 1p 相 关 的 密码 条 目 。 如 果 设 有 此 用 户 ， 或 者 
1D 具 有 超级 用 户 特权 ， 记 录 日 志 然后 退出 ， 否 则 ， 调 用 setuid 将 实际 和 有 效 
用 户 ID 改 为 1p 用 户 ID。 为 了 避免 暴露 系统 ， 如 果 不 能 碱 小 特权 ， 那 么 就 选择 不 
提供 任何 服务 。 


pthread create(&tid, NULL, printer thread, NULL); 
pthread create(&tid, NULL, signal thread, NULL); 
build qonstart(); 


log msg("daemon initialized"); 


for (;;) { 
rset = rendezvous; 
if (select (maxfd+1, &rset, NULL, NULL, NULL) « 0) 
log sys("select failed"); 
for (i = 0; i <= maxfd; i++) { 
if (FD ISSET(i, &rset)) { 


/* 

* Accept the connection and handle 

* the request. 

*/ 
sockfd = accept (i, NULL, NULL); 

if (sockfd < 0) 

log_ret ("accept failed"); 
pthread_create(&tid, NULL, client_thread, 
(void *)sockfd) ; 


exit (1); 


调用 pthread_create 丙 次， 创建 一 个 处 理 信 和 号 的 线程 和 一 个 与 打印 机 通信 的 
线程 。( 通 过 限制 打印 机 只 与 一 个 线程 通信 ， 可 以 简化 与 打印 机 相关 的 数据 结构 
的 锁定 。) 然后 调用 builq_aqonstart 在 /var/spool/printer 目 录 中 搜索 
任何 挂 起 的 作业 。 对 于 找到 的 每 个 作业 ， 将 建立 一 个 结构 ， 让 打印 机 线程 知道 
要 将 该 作业 的 文件 送 到 打印 机 。 到 此 ， 完 成 守护 进程 程序 的 设置 ， 因 此 记录 日 
志 ， 表 明和 守护 进程 程序 初始 化 成 功 完成 。 

将 rendezvous fq_set 结 构 复制 到 rset， 然 后 调用 select 等 待 其 中 的 一 个 
文件 描述 符 变 为 可 读 。 必 须 复 制 rendezvous， 因 为 select 会 修改 传人 的 
fd_.set 结 构 来 包含 满足 事件 的 文件 描述 符 。 既 然 服 务 器 已 经 将 套 接 字 初 始 化 
完毕 , 一 个 可 读 的 文件 描述 符 就 意味 着 一 个 连接 请 求 需要 处 理 。 当 select 返 
回 时 ， 检 查 rset 来 获取 可 读 的 文件 描述 符 。 如 果 找 到 一 个 ， 调 用 accept 接 受 
该 连接 请 求 。 如 果 失 败 ， 记 录 日 志 然 后 继续 检查 更 多 的 可 读 文件 描述 符 ， 否 则 ， 
创建 一 个 线程 来 处 理 客户 端 请 求 。 主 线程 main 一 直 循 环 ， 将 请 求 发 送 到 其 他 线 
程 处 理 ， 永 远 不 应 到 达 exit 语 句 。 


bbs.theithome.com 











215 源 代码 625 








169 
170 
171 
172 
173 
174 
175 
176 
177 
178 
179 


180 
181 
182 
183 


184 
185 
186 
187 
188 
189 
190 
191 
192 
193 


Initialize the job ID file. Use a record lock to prevent 
more than one printer daemon from running at a time. 


LOCKING: none, except for record-lock on job ID file. 


*/ 
void 
init_request (void) 


int n; 
char name [FILENMSZ] ; 


sprintf (name, "%s/%s", SPOOLDIR, JOBFILE) ; 
jobfd = open(name, O CREAT|O RDWR, S IRUSR|S IWUSR) ; 
if (write lock(jobfd, 0, SEEK SET, 0) « 0) 


log quit("daemon already running"); 


/* 


* Reuse the name buffer for the job counter. 


*/ 


if ((n = read(jobfd, name, FILENMSZ)) « 0) 


log sys("can't read job file"); 


if (n == 0) 


nextjob - 1; 


else 


) 


nextjob - atol(name); 


[169-183] 函数 init_request 做 两 件 事情 : 在 作业 文件 /var/spool/printer/ 


jobno 上 放 一 个 记录 锁 ， 然 后 读 该 文件 以 确定 下 一 个 要 赋予 的 作业 号 。 在 整个 
文件 上 放置 一 把 写 锁 ， 表明 守护 进程 程序 正在 运行 。 如 果 当 前 已 有 一 个 守护 进 
程 程序 正在 运行 ， 想 启动 另外 的 打印 假 脱 机 守护 进程 程序 ， 这 些 额外 的 程序 将 
无 法 获得 写 锁 ， 并 将 退出 。 因 此 ， 同 时 只 能 有 一 个 守护 进程 程序 在 运行 。( 在 程 
序 清单 13-2 中 使 用 过 这 种 技术 ， 在 14.3 节 中 讨论 过 write_lock 宏 。) 


[184-193] 作业 文件 包含 一 个 ASCII 码 整数 字符 串 ， 该 字符 串 表 示 下 一 个 作业 号 。 如 果 文 
件 刚 创建 并 因此 为 空 ， 那 么 将 nextjob 设 为 1， 否 则 ， 使 用 atol 把 字符 串 转换 
为 整数 并 将 其 作为 下 一 个 作业 号 。 让 jobfa 对 于 作业 文件 保持 打开 状态 ， 这 样 
当 作 业 创 建 时 就 能 够 更 新 作业 号 。 不 能 关闭 该 文件 ， 因 为 这 将 释放 已 经 放置 在 
上 面 的 写 锁 。 
在 一 个 长 整 型 为 64 位 的 系统 上 ， 至 少 需要 一 个 21 字 节 的 缓冲 区 来 容纳 代表 最 大 
长 整 型 数 的 字符 串 。 这 里 重用 文件 名 字 的 缓冲 区 ， 因 为 在 print .h 中 
FILENMSZ 定 义 为 64。 

194 /* 

195 * Initialize printer information. 

196 * 

197 * LOCKING: none. 

198 */ 

199 void 

200 init_printer (void) 

201 

202 printer = get printaddr(); 

203 


if (printer == NULL) { 
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204 
205 
206 
207 
208 
209 
210 
211 


212 
213 
214 
215 
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log_msg("no printer device registered"); 
exit(1); 

) 

printer name - printer-»ai canonname; 

if (printer name -- NULL) 
printer name = "printer"; 

log msgí("printer is $8", printer name); 


) 


/* 
* Update the job 1D file with the next job number. 
* 
* LOCKING: none. 
*/ 
void 
update_jobno (void) 
{ 


char buf [32]; A 


lseek(jobfd, 0, SEEK SET); 

sprintf (buf, "%1d", nextjob); 

if (write(jobfd, buf, strlen(buf)) < 0) 
log sys("can't update job file"); 


) 





[194-211] init_printerMRAFR EJTEIBLE S AE. Wifiget printaddr (来 


BHutil.c) 获得 打印 机 地 址 ， 如 果 失 败 ， 记 录 日 志 并 退出 。 但 是 不 能 使 用 
lo0g_sys 记 录 日 志 ， 因 为 get_printaddr 可 能 没有 设置 errno 就 失败 了 。 实 
际 上 ， 当 其 失败 并 设置 errno 后 ，get_printaddr 自 己 会 对 错误 信息 记录 日 
志 。 将 打印 机 名 字 设 为 addarinfo 结 构 中 的 ai_canonname， 如 果 该 字段 为 空 ， 
将 打印 机 名 字 设 为 默认 值 printer。 注意 ， 将 使 用 的 打印 机 名 字 记 录 在 日 志 中 ， 
以 帮助 管理 员 能 够 诊断 问题 。 


[212-225] update_jobno 函 数 用 于 在 作业 文件 /var/spool/printer/jobno 中 写 入 


226 
227 
228 
229 
230 
231 
232 
233 
234 


235 
236 
237 
238 
239 
240 
241 


242 


下 一 个 作业 号 。 首 先 ， 找 到 文件 开头 。 然 后 ， 将 整数 作业 号 转换 为 字符 叫 并 写 
入 文件 。 如 果 写 入 失败 ， 记录 日 志 并 退出 。 





/* 
* Get the next job number. 
* 
* LOCKING: acquires and releases joblock. 
*/ 
long 
get_newjobno (void) 
{ 


long jobid; 


pthread mutex lock(&joblock); 
jobid = nextjob++; 
if (nextjob <= 0) 

nextjob = 1; 
pthread mutex unlock(&joblock); 
return(jobid); 


/* 
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243 * Add a new job to the list of pending jobs. Then signal 
244 * the printer thread that a job is pending. 

245 * 

246 * LOCKING: acquires and releases joblock. 

247 */ 

248 void 

249 add job(struct printreq *reqp, long jobid) 

250 { 

251 struct job *jp; 

252 if ((jp = malloc (sizeof (struct job))) ==. NULL) 
253 log sys("malloc failed"); 

254 memcpy (&jp->req, reqp, sizeof(struct printreq)); 





[226-241] get_newjobno 函 数 用 于 获得 下 一 个 作业 号 。 首 先 将 joblock 互 斥 量 锁 住 ， 对 
nextjob 变 量 增 量 ， 当 超出 范围 时 回 绕 。 然 后 对 互 斥 量 解锁 并 返回 增 量 前 的 
nextjob 值 。 多 个 线程 可 以 同时 调用 get_newjobno， 需要 串 行 化 访问 下 一 个 
作业 号 ， 以 使 得 每 个 线程 得 到 一 个 唯一 的 作业 号 。 (参考 图 11-4， 考 察 如 果 在 这 
种 情况 下 不 串 行 化 线程 会 发 生 什 么 情况 。) 

[242-254] addq_job 函 数 用 于 在 挂 起 的 打印 作业 列表 末尾 增加 一 个 新 的 打印 请 求 。 首 先 为 
job 结构 分 配 空间 ， 如 果 失 败 ， 记 录 日 志 并 退出 。 此 时 ， 打 印 请 求 已 经 安全 地 
存在 磁盘 上 ， 当 打印 假 脱 机 守护 进程 程序 重 起 时 ， 会 重新 读 取 这 些 请 求 。 当 为 
新 作业 分 配 空间 完毕 后 ， 将 客户 端的 请 求 结构 复制 到 作业 结构 中 。 在 print .h 
中 作业 结构 job 包含 一 对 指针 列表 、 一 个 作业 ID 和 一 个 从 客户 端 print 命 令 发 








783 
送 过 来 的 printreq 结 构 副本 。 ES 
255 jp->jobid = jobid; 
256 jp->next = NULL; 
257 pthread_mutex_lock (&joblock) ; 
258 jp->prev = jobtail; 
259 if (jobtail == NULL) 
260 jobhead = jp; 
261 else 
262 jobtail->next = jp; 
263 jobtail = jp; 
264 pthread mutex unlock(&joblock); 
265 pthread cond signal(&jobwait); 
266 } 
267 /* 
268 * Replace a job back on the head of the list. 
269 * 
270 * LOCKING: acquires and releases joblock. 
271 */ 
272 void 
273 replace job(struct job *jp) 
274 
275 pthread mutex lock(&joblock); 
276 jp->prev = NULL; 
277 jp->next = jobhead; 
278 — if (jobhead == NULL) 
279 jobtail = jp; 
280 else 
281 jobhead-»prev = jp; 
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jobhead = jp; 
pthread mutex unlock(&joblock); 


) 





[255-266] 将 作业 ID 保 存 并 锁 住 job1lock 互 斥 量 以 获得 对 打印 作业 链表 的 独占 访问 。 将 在 


该 列表 末尾 增加 新 的 作业 结构 。 将 新 的 作业 结构 的 向 前 指针 (previous pointer) 
指向 列表 中 最 后 一 个 作业 。 如 果 列 表 为 空 ， 将 jobhead 指 向 新 的 结构 ， 否 则 ， 
将 列表 中 最 后 一 项 的 向 后 指针 (next pointer) 指向 新 的 结构 。 然 后 设置 
jobtai1l 指 向 新 的 结构 。 对 互 斥 量 解锁 ， 然 后 给 打印 机 线程 发 信号 ， 告 诉 该 线 
程 另 一 个 作业 可 用 了 。 


[267-284] 函数 replace_job 用 于 将 作业 插入 到 挂 起 作业 列表 头 部 。 需 要 获得 joblock 互 


斥 量 ， 将 job 结 构 中 的 向 前 指针 (previous pointer) 设 为 空 (null) ， 将 向 后 指针 
(next pointer) 指向 表 头 。 如 果 列 表 为 空 ， 将 jobtail 指 向 插入 的 job 结 构 ， 否 
则 、 将 列表 中 第 一 个 job 结 构 的 向 前 指针 指向 插入 的 job 结 构 。 然 后 将 jobhead 
指针 指向 插入 的 job 结 构 ， 成 为 新 的 表 头 。 最 后 ， 释 放 joblock 互 斥 量 。 





314 
315 


316 
317 
318 


/* 
* Remove a job from the list of pending jobs. 
* 
* LOCKING: caller must hold joblock. 
*/ 
void 
remove job(struct job *target) 


if (target-»next != NULL) 
target-»next-»prev - target-»prev; 
else 
jobtail = target-»prev; 
if (target-»prev != NULL) 
target-»prev-»next = target-»next; 
else 
jobhead = target-»next; 
) 


/* 
* Check the spool directory for pending jobs on start-up. 
* 
* LOCKING: none. 
*/ 
void 
build qonstart (void) 


int fd, err, nr; 
long jobid; 
DIR *dirp; 


struct dirent *entp; 
struct printreq req; 


char dname [FILENMSZ), fname [FILENMSZ] ; 
sprintf (dname, "%s/%s", SPOOLDIR, REQDIR) ; 
if ((dirp = opendir(dname)) == NULL) 

return; 





[285-301] 给 定 要 删除 的 作业 的 指针 ，remove_job 将 作业 从 挂 起 的 作业 列表 中 删除 。 调 
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用 者 首先 须 持 有 joblock 互 扩 量 。 如 果 向 后 指针 不 为 空 ， 将 下 一 个 条 目的 向 前 
指针 指向 被 删除 目标 的 向 前 指针 所 指向 的 条 目 ， 否 则 ， 该 条 目 为 列表 中 最 后 一 
个 ， 因 此 将 jobtai1 指 向 被 删除 目标 的 向 前 指针 所 指向 的 条 目 。 如 果 被 删除 目 
标的 向 前 指针 不 为 空 ， 将 前 一 个 条 目的 向 后 指针 指向 被 删除 目标 的 向 后 指针 所 
指向 的 条 目 ， 否 则 ， 该 条 目 是 列表 中 第 一 个 条 目 ， 将 jobheadq 设 为 指向 被 删除 
目标 后 面 的 那个 条 目 。 

[302-318] 当 守 护 进 程 程序 启动 时 ， 调 用 builq_qonstart 从 存储 在 /var/spool/ 
printer/reqs 中 的 磁盘 文件 建立 一 个 内 存 中 的 打印 作业 列表 。 如 果 不 能 打开 


该 目录 ， 表 示 没 有 打印 作业 要 处 理 ， 因 此 就 返回 。 785 
319 while ((entp = readdir(dirp)) != NULL) { 
320 /* 
321 * Skip "." and ".." 
322 */ 
323 if (strcmp(entp-»d name, ".") == 0 || 
324 stremp(entp-»d name, "..") == 0) 
325 continue; 
326 /* 
327 * Read the request structure. 
328 */ 
329 sprintf (fname, "%s/%s/%ts", SPOOLDIR, REQDIR, entp-»d name); 
330 if ((fd = open(fname, O RDONLY)) « 0) 
331 continue; 
332 nr = read(fd, &req, sizeof(struct printreq)); 
333 if (nr !- sizeof (struct printreq)) { 
334 if (nr « 0) 
335 err - errno; 
336 else 
337 err - EIO; 
338 close (fd); 
339 log_msg("build_qonstart: can't read %s: %s", 
340 fname, strerror(err)); 
341 unlink (fname) ; 
342 sprintf (fname, "%ts/%s/%s", SPOOLDIR, DATADIR, 
343 entp-»d name); 
344 unlink (fname) ; 
345 continue; 
346 
347 jobid = atol(entp-»d name); 
348 log_msg("adding job $1d to queue", jobid); 
349 add job(&req, jobid); 
350 
351 closedir (dirp); 
352 


[319-325] 在 目录 中 一 次 读 取 一 个 条 目 ， 忽 略 .和 .…。 

[326-346] 对 于 每 个 条 目 ， 创 建文 件 的 完全 路 径 名 并 打开 文件 以 供 读 取 。 如 果 open 调 用 失 
败 ， 就 跳 过 该 文件 。 否 则 ， 读 取保 存在 文件 中 的 printreq 结 构 。 如 果 不 能 读 
取 整 个 结构 ， 关 闭 该 文件 ， 记 录 日 志 并 unlink 访 文件。 那么 就 建立 了 相应 数据 文 
件 的 完全 路 径 名 ， 然 后 unlink 该 文件 。 

[347-352] 如 果 能 够 读 取 完整 的 printreq 结 构 ， 则 将 文件 名 转换 为 作业 ID (文件 名 就 是 
其 作业 ID)， 记 录 日 志 ， 然 后 将 请 求 加 入 到 挂 起 的 打印 作业 列表 。 当 读 完 整个 目 
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录 后 ，readdir 返 回 NULL， 关 闭 目录 然后 返回 。 


/* 
* Accept a print job from a client. 
* 
* LOCKING: none. 
*/ 
void * 
client thread(void *arg) 


int n, fd, sockfd, nr, nw, first; 
long jobid; 

pthread t tid; 

struct printreq req; 

struct printresp res; 

char name [FILENMSZ]; 

char buf [IOBUFS2] ; 


tid = pthread_self(); 

pthread_cleanup push(client_cleanup, (void *)tid); 
sockfd = (int)arg; 

add_worker (tid, sockfd) ; 


/* 
* Read the request header. 
xj 
if ((n = treadn(sockfd, &req, sizeof(struct printreq), 10)) != 
sizeof (struct printreq)) { 
res.jobid = 0; 
if (n < 0) 
res.retcode = htonl (errno); 
else 
res.retcode = htonl{EIO); 
strncpy(res.msg, strerror(res.retcode), MSGLEN MAX); 
writen(sockfd, &res, sizeof(struct printresp)); 
pthread exit((void *)1); 


) 


[353-371] 当 连 接 请 求 被 接受 时 ，main 线 程 中 派生 出 client_threaG， 其 作用 是 从 客户 


端 print 命 令 中 接收 要 打印 的 文件 。 为 每 个 客户 端 打印 请 求 分 别 创建 一 个 独立 
的 线程 。 

首先 是 安装 线程 清理 处 理 程序 (参见 11.5 节 中 线程 清理 处 理 程序 的 讨论 ) B 
处 理 程序 是 client_cleanup， 将 在 后 面 用 到 。 它 仅 带 一 个 参数 ， 线 程 ID 。 然 
后 调用 add_worker 来 创建 一 个 worker_thread 结 构 并 将 其 加 入 到 活跃 的 客 
户 端 线程 列表 中 。 


[372-385] 此 时 ， 完 成 了 线程 的 初始 化 任务 ， 因 此 从 客户 端 读 取 请 求 首部 。 如 果 客 户 端 发 


386 
387 


388 
389 
390 
391 


送 的 数据 少 于 期 望 或 遇 到 错误 ， 则 响应 一 个 消息 ， 该 消息 指出 错误 的 原因 ， 然 
后 调用 pthreadG_exit 结 束 线程 。 


req.size = ntohl (req.size) ; 


req.flags = ntohl (req. flags) ; 


/* 
* Create the data file. 
*/ 


jobid = get newjobno(); 
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392 sprintf (name, "%s/%s/%ld", SPOOLDIR, DATADIR, jobid); 

393 if ((fd = creat (name, FILEPERM)) < 0) { 

394 res.jobid = 0; 

395 if (n « 0) 

396 res.retcode - htonl(errno); 

397 else 

398 res.retcode - htonl(EIO); 

399 log msgí("client thread: can't create ts: $s", name, 

400 strerror (res.retcode)); 

401 strncpy(res.msg, strerror(res.retcode), MSGLEN MAX); 

402 writen(sockfd, &res, sizeof(struct printresp)); 

403 pthread exit((void *)1); 

404 ) 

405 /* 

406 * Read the file and store it in the spool directory. 

407 */ 

408 first = 1; 

409 while ((nr = tread(sockfd, buf, IOBUFSZ, 20)) > 0) { 

410 if (first) { 

411 first = 0; 

412 if (strncmp (buf, "%!PS", 4) != 0) 

413 req.flags |- PR TEXT; 

414 ) 

[386-404] 将 请 求 首部 中 的 整数 字段 转换 成 主机 字 节 序 ， 调 用 get_newjobno 来 保存 该 打 
印 请 求 的 下 一 个 作业 ID 。 建 立 作 业 数 据 文 件 ， 文 件 名 为 /vary/ 
spool/printer/data/jobid， 其 中 jobid 是 请 求 的 作业 ID。 使 用 权限 许可 来 
防止 其 他 人 能 够 读 取 这 些 文件 (print.h 中 定义 FILEPERM 为 S_IRUSR 1 
S_IWUSR)。 如 果 不 能 创建 该 文件 ， 则 记录 错误 日 志 ， 发 送 失败 响应 给 客户 端 , 
调用 pthread_exit 结 束 线程 。 

[405-414] 读 取 来 自 客户 端的 文件 内 容 ， 要 将 其 写 入 数据 文件 的 私有 副本 中 。 但 是 在 写 任 
何 东西 之 前 ， 需 要 在 第 一 次 循环 时 检查 一 下 是 否 为 PostScript 文 件 。 如 果 访 文件 
不 是 以 $!1PS 模 式 开头 ， 可 以 假定 其 为 纯 文本 文件 ， 这 种 情况 下 在 请 求 首部 中 设 
置 PR_TEXT 标 志 。( 如 果 在 执行 print 命 令 时 包含 了 -t 标 志 ， 那 么 客户 端 也 会 
设置 此 标志 。) 尽管 PostScript 程 序 不 要 求 以 模式 %!PS 开 始 ， 但 文档 格式 指南 
(Adobe Systems [1999]) 强烈 推荐 这 种 方式 。 

415 nw = write(fd, buf, nr); 

416 if (nw {= nr) { 

417 if (nw « 0) 

418 res.retcode - htonl(errno); 

419 else 

420 res.retcode - htonl(EIO); 

421 log msg("client thread: can't write ts: $s", name, 

422 strerror (res.retcode)); 

423 close (fd); 

424 strncpy (res.msg, strerror(res.retcode), MSGLEN MAX); 

425 writen(sockfd, &res, sizeof(struct printresp)); 

426 unlink (name); 

427 pthread exit((void *)1); 

428 } 

429 

430 close (fd); 
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/* 
* Create the control file. 
*/ 
Sprintf(name, "%s/%s/%ld", SPOOLDIR, REQDIR, jobid); 
fd = creat (name, FILEPERM); 
if (fd < 0) { 
res.jobid = 0; 
if (n « Q) 
res.retcode = htonl (errno); 
else 
res.retcode = htonl (EIO); 
log msg("client thread: can't create $9: $s", name, 
strerror (res.retcode) ); 
strncpy(res.msg, strerror(res.retcode), MSGLEN MAX); 
writen(sockfd, &res, sizeof (struct printresp)); 
sprintf (name, "%s/%s/%1d", SPOOLDIR, DATADIR, jobid); 
unlink (name); 
pthread exit((void *)1); 


) 





[415-430] 将 从 客户 端 读 取 的 数据 写 人 到 数据 文件 。 如 果 write 失 败 ， 记 录 出 错 消息 日 志 ， 


关闭 数据 文件 的 文件 描述 符 ， 发 送出 错 消息 给 客户 端 ， 删 除数 据 文件 ， 调 用 
pthread_exit 终 止 线程 。 注 意 ， 我 们 不 需要 显 式 关闭 套 接 字 文 件 描述 符 。 当 
调用 pthread_exit 时 ， 线 程 清理 处 理 程序 会 处 理 这 些 事情 。 
当 接收 到 所 有 要 打印 的 数据 时 ， 关 闭 数据 文件 的 文件 描述 符 。 


[431-449] 接 下 来 ， 创 建文 件 /var/spool/printer/reqs /jobid 以 记 住 打印 请 求 。 如 果 


450 
451 
452 
453 
454 
455 
456 
457 
458 
459 
460 
461 
462 
463 
464 
465 
466 
467 


468 
469 
470 
471 
472 
473 
474 


475 
476 
477 


失败 ， 则 记录 错误 日 志 ， 发 送出 错 响 应 给 客户 端 ， 删 除数 据 文件 ， 并 终止 线程 。 





nw = write(fd, &req, sizeof (struct printreq)); 
if (nw != sizeof(struct printreq)) { 
res.jobid = 0; 
if (nw < 0) 
res.retcode = htonl (errno); 
else 
res.retcode = htonl(EIO); 
log msg("client thread: can't write $5: %s", name, 
Strerror (res.retcode)); 
close (fd); 
strncpy(res.msg, strerror(res.retcode), MSGLEN MAX); 
writen(sockfd, &res, sizeof(struct printresp)); 
unlink (name); 
sprintf(name, "%s/%s/%ld", SPOOLDIR, DATADIR, jobid); 
unlink (name); 
pthread exit((void *)1); 


close (fd); 
/* 


* Send response to client. 
*/ 
res.retcode = 0; 
res.jobid = htonl (jobid) ; 
sprintf (res.msg, "request ID %ld", jobid); 
writen(sockfd, &res, sizeof(struct printresp)); 


/* 
* Notify the printer thread, clean up, and exit. 


*/ 
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log_msg ("adding job $1d to queue", jobid); 
add_job(&req, jobid); 

pthread cleanup pop (1); 

return((void *)0); 


) 


[450-466] 将 printreg 写 人 控制 文件 。 如 果 出 错 ， 则 记录 日 志 ， 关 闭 控制 文件 描述 符 ， 


发 送 失败 响应 给 客户 端 ， 删 除数 据 和 控制 文件 ， 并 终止 线程 。 


[467-474] 关闭 控制 文件 的 文件 描述 符 ， 并 发 送 消息 给 客户 端 ， 该 消息 包括 作业 ID 和 成 功 


状态 (retcode 设 为 0)。 


[475-482] 调用 aaa_jop 将 接收 到 的 作业 加 入 到 挂 起 的 打印 作业 列表 中 ， 调 用 


483 
484 
485 
486 
487 
488 
489 
490 
491 


492 
493 
494 
495 
496 
497 
498 
499 
500 
501 
502 
503 
504 
505 
506 


507 
508 
509 
510 
511 
512 
513 
514 
515 


516 
517 
518 
519 
520 


pthread_cleanup_pop 完 成 清理 过 程 ， 当 返回 时 线程 终止 。 

注意 ， 线 程 退 出 之 前 ， 必 须 关 闭 不 再 使 用 的 任何 文件 描述 符 。 与 进程 终止 不 同 ， 
当 一 个 线程 结束 并 且 进 程 中 仍 有 其 他 线程 了 时， 文件 描述 符 不 会 自动 关闭 。 如 果 
不 关闭 不 需要 的 文件 描述 符 ， 终 将 耗 尽 资源 。 


/* 
* Add a worker to the list of worker threads. 
* 


* LOCKING: acquires and releases workerlock. 


*/ 
void 
add worker(pthread t tid, int sockfd) 
{ 
struct worker thread *wtp; 
if ((wtp = malloc(sizeof (struct worker thread))) == NULL) { 


log ret("add worker: can't malloc"); 
pthread exit((void *)1); 


wtp-»tid = tid; 
wtp->sockfd = sockfd; 
pthread_mutex_lock (&workerlock) ; 
wtp-»prev = NULL; 
wtp-»next - workers; 
if (workers -- NULL) 

workers - wtp; 
else 

workers-»prev = wtp; 
pthread_mutex_unlock (&workerlock) ; 


} 
/* 


* Cancel (kill) all outstanding workers. 
* 


* LOCKING: acquires and releases workerlock. 
x4 

void 

kill workers (void) 


{ 


struct worker thread *wtp; 


pthread mutex lock(&workerlock); . 

for (wtp = workers; wtp !- NULL; wtp = wtp-»next) 
pthread cancel(wtp-»tid); 

pthread mutex unlock (&workerlock) ; 


) 
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[483-506] add_worker 将 一 个 worker_thread 结 构 加 入 到 活动 线程 列表 中 。 分 配 该 结 
构 需 要 的 内 存 ， 初 始 化 它 ， 锁 住 workerlock 互 斥 量 ， 将 结构 加 入 到 列表 的 头 
部 ， 然 后 解锁 互 斥 量 。 

[507-520] kil1l_workezrs 装 数 遍 历 工作 者 线程 列表 然后 一 一 删除 ， 遍 历 列表 时 持 有 
workerlock。 注 意 ，pthread_cancel 仅 仅 安 排 线 程 删除 ， 实 际 的 删除 动作 





791 在 每 个 线程 到 达 下 一 个 删除 点 时 发 生 。 
521 /* 
522 * Cancellation routine for the worker thread. 
523 * 
524 * LOCKING: acquires and releases workerlock. 
525 */ 
526 void 
527 client cleanup(void *arg) 
528 
529 struct worker thread *wtp; 
530 pthread t tid; 
531 tid = (pthread t)arg; 
532 pthread mutex lock (&workerlock) ; 
533 for (wtp = workers; wtp !- NULL; wtp = wtp-»next) { 
534 if (wtp-»tid == tid) { 
535 if (wtp-»next != NULL) 
536 wtp->next->prev = wtp->prev; 
537 if (wtp-»prev != NULL) 
538 wtp-»prev-»next = wtp-»next; 
539 else 
540 workers - wtp-»next; 
541 break; 
542 } 
543 
544 pthread_mutex_unlock (&workerlock) ; 
545 if (wtp != NULL) { 
546 Close (wtp->sockfd) ; 
547 free (wtp); 
548 } 
549 } 


ar —— ee EQ Em 

[521-543] 函数 client_cleanup 是 与 客户 端 命令 通信 的 工作 者 线程 的 线程 清理 处 理 程 
序 。 当 线程 调用 pthread_exit 了 时 ， 用 一 个 非 零 参 数 调用 pthread_ 
cleanup._pop 时 ,或 者 响应 一 个 删除 请 求 时 ，c1lient_cleanup 函 数 被 调用 。 
其 参数 是 终止 线程 的 线程 ID。 
我 们 锁 住 workerlock 互 斥 量 然后 搜索 工作 者 线程 列表 ， 直 到 找到 一 个 匹配 的 
线程 ID。 当 我 们 找到 一 个 匹配 时 ， 将 其 从 列表 中 删除 工作 者 线程 结构 并 且 停 止 
搜索 。 

[544-549] 解锁 workerlock 互 斥 量 ,关闭 线程 用 于 和 客户 端 通信 的 套 接 字 文件 描述 符 ， 
然后 释放 worker_thread 结 构 的 内 存 。 
既然 要 获得 worker1lock 互 斥 量 ， 当 ki11_workers 函 数 正 在 遍历 列表 时 ， 如 
果 一 个 线程 到 达 一 个 删除 点 ， 必 须 等 待 直到 ki11_workers 释 放 互 斥 量 时 才 可 
以 继续 处 理 。 


- 
O 
N 
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572 
573 
574 
575 


576 
577 
578 
579 
580 
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/* 
* Deal with signals. 
* 
* LOCKING: acquires and releases configlock. 
*/ 
void * 
signal thread(void *arg) 


int err, signo; 

for (;;) { 
err = sigwait(&mask, &signo); 
if (err != 0) 


log quit("sigwait failed: $s", strerror(err)); 
switch (signo) ( 
case SIGHUP: 
/* 
* Schedule to re-read the configuration file. 
*/ 
pthread mutex lock (&configlock) ; 
reread - 1; 
pthread mutex unlock(&configlock); 
break; 


case SIGTERM: 
kill workers(); 
log msg("terminate with signal %s", strsignal(signo)); 
exit(0); 


default: 
kill workers(); 
log quit("unexpected signal td", signo); 


) 
) 


[550-563] 函数 signal_thread 由 负责 处 理 信号 的 线程 运行 。 在 main 函 数 中 ， 初 始 化 信 


号 掩 码 ， 该 掩 码 包括 SIGHUP 和 SIGTERM。 这 里 ， 调 用 sigwait 来 等 待 这 些 信 
号 中 的 一 个 出 现 。 如 果 sigwait 失 败 ， 记 录 出 错 日 志 并 退出 。 


[564-571] 如 果 接 收 到 SITGHUP ， 就 需要 获得 configlock 互 斥 量 ， 将 zeread 变 量 设 为 1， 


然后 释放 互 斥 量 。 这 就 告诉 打印 守护 进程 程序 在 其 处 理 循 环 的 下 一 次 迭代 时 再 
次 读 取 配 置 文件 。 


[572-575] 如 果 接 收 到 SIGTERM， 调 用 ki11_workers 来 杀 掉 所 有 的 工作 者 线程 ， 记 录 日 


志 ， 然 后 调用 exit 终 止 进程 。 


[576-581] 如 果 接 收 到 非 期 望 的 信号 ， 则 杀 死 工作 者 线程 并 调用 1og_quit 来 记录 日 志 然 


582 
583 
584 
585 
586 
587 
588 
589 


后 退出 。 


/* 
* Add an option to the IPP header. 
* 


* LOCKING: none. 
*/ 
char * 
add option(char *cp, int tag, char *optname, char *optval) 
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590 
591 
592 
593 
594 


595 
596 
597 
598 
599 
600 
601 
602 
603 
604 
605 
606 
607 
608 


[582-594] 函数 add_option 用 于 在 送 往 打印 机 的 IPP 首 部 中 添加 选项 。 回 亿 图 21-3， 属 性 
的 格式 是 : 描述 属性 的 类 型 的 1 字 节 标志 ， 然 后 是 以 2 字 节 的 二 进 制 整数 形式 存 
储 的 属性 名 字 的 长 度 ， 接 着 是 名 字 ， 属 性 值 的 大 小 ， 最 后 是 属性 值 本 身 。 

IPP 没 有 意图 去 控制 伐 入 在 首部 的 二 进 制 整数 的 对 齐 方式 。 一 些 处 理 器 架构 ( 例 
如 SPARC) 并 不 能 从 任意 地 址 装 入 一 个 整数 。 这 意味 着 不 能 通过 如 下 方式 在 IPP 
首部 存放 一 个 整数 : 该 方 式 将 一 个 指针 转换 成 int16_t 指 向 在 首部 存放 整数 的 
地 址 。 代 替 地 ， 需 要 一 次 复制 1] 字 节 整 数 。 这 就 是 为 什么 定义 一 个 包含 16 位 整数 


} 


[595-608] 
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int n; 
union { 
intl6 t s; 
char c[2]; 
) u; 


*cp++ = tag; 

n = strlen(optname) ; 
u.s = htons(n); 
*cp++ = u.c[0]; 
*cp++ = u.c[1]; 
strcpy (cp, optname) ; 
cp += n; 

n = strlen(optval) ; 
u.s = htons(n); 
*cp++ = u.c[0]; 
*cp++ = u.c[11; 
strcpy (cp, optval); 
return (cp + n); 





和 2 字 节 数组 的 union。 


在 首部 存储 标志 并 将 属性 名 字 的 长 度 转换 为 网 络 字 节 序 。 一 次 复制 1 个 字 节 到 首 
部 。 接 着 复制 属性 名 字 。 重 复 这 个 过 程 ， 继 续 复制 属性 值 ， 然 后 返回 首部 中 下 


一 部 分 应 该 开始 的 地 址 。 





/* 





* Single thread to communicate with the printer. 


* 


* LOCKING: acquires and releases joblock and configlock. 


*/ 


void * 


printer thread(void *arg) 


Struct job 
int 

char 

struct ipp hdr 
struct stat 
Struct iovec 
char 

char 

char 

char 

char 


for (;;) { 
/* 


*jp; 

hlen, ilen, sockfd, fd, nr, nw; 
*icp, *hcp; 
*hp; 

Sbuf ; 

iov[2]; 

name [FILENMSZ]; 
hbuf [HBUFSZ] ; 
ibuf [IBUFSZ]; 
buf [IOBUFSZ] ; 
str[64]; 
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* Get a job to print. 
*/ 
pthread mutex lock (&joblock) ; 
while (jobhead == NULL) { 
log msg("printer thread: waiting..."); 
pthread cond wait(&jobwait, &joblock); 
) 
remove job(jp = jobhead); 
log msgí("printer thread: picked up job $1d", jp-»jobid); 
pthread mutex unlock (&joblock); 


update jobno(); 


[609-627] 国 数 printer_thread 由 与 网 络 打印 机 通信 的 线程 运行 。 使 用 icp 和 ipbuf 来 


[628-640] 


641 
642 
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644 
645 
646 
647 
648 
649 
650 
651 
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653 
654 


655 
656 
657 
658 
659 
660 
661 
662 
663 
664 
665 
666 
667 
668 
669 
670 
671 





建立 IPP 首 部 。 使 用 hcp 和 hbuf 建 立 HTTP 首 部 。 需 要 在 独立 的 缓冲 区 中 建立 首 
部 。HTTP 首 部 包括 ASCII 表 示 的 长 度 字段 ,而 且 在 拼装 出 IPP 首 部 之 前 ， 并 不 知 
道 应 该 预 留 多 大 的 空间 。 在 一 次 调用 中 使 用 writev 来 写 这 两 个 首部 。 

打印 机 线程 运行 在 一 个 无 限 循环 中 ， 等 待 将 作业 传送 到 打印 机 。 使 用 joblock 
互 斥 量 来 保护 作业 列表 。 如 果 作 业 没 有 挂 起 ， 使 用 pthread_cond_wait 来 等 
待 到 来 的 作业 。 当 一 个 作业 准备 好 时 ， 调 用 remove_job 将 其 从 列表 中 删除 。 
此 时 仍 持 有 互 斥 量 ， 因 此 释放 互 斥 量 并 调用 update_jobno 将 下 一 个 作业 号 写 
Al /var/spool/printer/jobno, 


/* 
* Check for a change in the config file. 
* 
/ 
pthread mutex lock (&configlock) ; 
if (reread) { 
freeaddrinfo(printer) ; 
printer = NULL; 
printer_name = NULL; 
reread = 0; 
pthread_mutex_unlock (&configlock) ; 
init printer(); 
} else { 
pthread_mutex_unlock (&configlock) ; 
} 


/* 
* Send job to printer. 
*/ 
sprintf (name, "%ts/%s/%ld", SPOOLDIR, DATADIR, jp-»jobid); 
if ((fd = open(name, O RDONLY)) « 0) { 
log msgí("job $1d canceled - can't open $s: $s", 
jp->jobid, name, strerror(errno)); 
free(jp); 
continue; 
} 
if (fstat(fd, &sbuf) « 0) { 
log msg("job $1d canceled - can't fstat $8: $s", 
jp->jobid, name, strerror(errno)); 
free (jp); 
close (fd); 
continue; 
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[641-654] 


[655-671] 


672 
673 
674 
675 
676 
677 
678 
679 
680 
681 
682 


683 
684 
685 
686 
687 
688 
689 
690 
691 
692 
693 
694 
695 
696 
697 
698 
699 


[672-682] 


[683-699] 


由 于 有 了 要 打印 的 作业 ， 检 查 一 下 配置 文件 有 无 改变 。 锁 住 configlock 并 检查 
reread 变 量 。 如 果 该 值 非 零 ， 那 么 释放 旧 的 adarinfo 列 表 ， 指 针 设 为 空 ， 解 
锁 互 斥 量 ， 然 后 调用 init_printer 来 重新 初始 化 指针 信息 。 既 然 从 main 线 程 
初始 化 后 只 有 这 个 上 下 文中 我 们 查看 并 可 能 更 改 打印 机 信息 ， 我 们 除了 使 用 
configlock 互 斥 量 来 保护 reread 标 志 的 状态 外 ， 不 需要 任何 其 他 的 同步 手段 。 
注意 ， 尽 管 在 此 函数 中 获得 和 释放 两 个 不 同 互 斥 量 ,但 是 并 没有 同时 持 有 两 个 
互 尺 量 ， 因 此 不 需要 建立 一 个 锁 层 次 (11.6 节 )。 

如 果 不 能 打开 数据 文件 ， 则 记录 日 志 ， 释 放 job 结 构 ， 然 后 继续 。 打 开 文 件 之 
后 ， 调 用 fstat 来 找到 文件 的 大 小 ， 如 果 失 败 ， 记 录 日 志 并 清理 ， 然 后 继续 。 


if ((sockfd = socket(AF INET, SOCK STREAM, 0)) < 0) { 
log msg ("job %ld deferred - can't create socket: %s", 
jp-»jobid, strerror(errno)); 
goto defer; 
) 
if (connect retry(sockfd, printer-»ai addr, 
printer-»ai addrlen) « 0) ( 
log msgí("job $1d deferred - can't contact printer: %s", 
jp->jobid, strerror(errno)); 
goto defer; 


/* 
* Set up the IPP header. 
*/ 
icp - ibuf; 
hp = (struct ipp hdr *)icp; 
hp-»major version - 1; 
hp-»minor version = 1; 
hp->operation = htons(OP PRINT JOB); 
hp-»request id = htonl(jp-»jobid); 
icp += offsetof (struct ipp hdr, attr group); 
*icp++ = TAG OPERATION ATTR; 
icp = add option(icp, TAG CHARSET, "attributes-charset", 
"utf-8"); 
icp = add option(icp, TAG NATULANG, 
"attributes-natural-language", "en-us"); 
sprintf (str, "“http://%s:%d", printer name, IPP PORT); 
icp = add option(icp, TAG URI, "printer-uri", str); 


打开 一 个 流 套 接 字 与 打印 机 通信 。 如 果 socket 调 用 失败 ， 跳 到 Gefer 处 , 在 
那里 将 会 清理 、 延 迟 一 段 时 间 然 后 再 尝试 。 如 果 能 够 建立 一 个 套 接 字 ， 调 用 
connect, retryJXEHBHTEIBL, 

接 下 来 ， 建 立 IPP 首 部 。 其 操作 是 打印 作业 (printjob) 请 求 。 使 用 htons 将 2 字 
节 的 操作 ID 从 主机 转 为 网 络 字 节 序 ， 使 用 hton1 将 4 字 节 的 作业 ID 从 主机 转 为 
网 络 字 节 序 。 完 成 首部 的 初始 化 之 后 ， 将 设置 标志 值 来 显示 其 后 跟随 的 操作 属 
性 。 调 用 add_option 来 将 属性 添加 到 报 文中 。 表 21-1 列 出 了 打印 作业 请 求 必 
需 的 和 可 选 的 操作 属性 。 前 三 个 是 必需 的 。 将 字符 集 设 为 UTF-8， 该 字符 集 是 
打印 机 必须 支持 的 ;指定 语言 为 en-us ， 即 代表 美国 英语 (U.S. English) , 5 
外 一 个 必需 的 属性 是 URI (Universal Resource Identifier), K Hik A 
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http://printer_name:631。( 实 际 上 应 该 向 打印 机 要 求 获 得 其 所 支持 的 URI 列 
表 并 从 中 选择 一 个 ， 但 那样 做 并 没有 增加 太 多 价值 ， 只 是 使 本 例 变 得 复杂 )。 797 





700 icp = add_option(icp, TAG NAMEWOLANG, 

701 "requesting-user-name", jp-»req.usernm); 

702 icp = add option(icp, TAG NAMEWOLANG, "job-name", 

703 jp->req.jobnm) ; 

704 if (jp->req.flags & PR TEXT) { 

705 icp = add option(icp, TAG MIMETYPE, "document-format", 
706 "text/plain"); 

707 } eise { 

708 icp = add option(icp, TAG MIMETYPE, "document-format", 
709 "application/postscript"); 

710 ) 

711 *icp++ = TAG END OF ATTR; 

712 ilen = icp - ibuf; 

713 /* 

714 * Set up the HTTP header. 

715 */ 

716 hep = hbuf; 

717 sprintf (hep, "POST /%s/ipp HTTP/1.1\r\n", printer name); 
718 hep += strlen(hcp); 

719 sprintf (hcp, "Content-Length: %ld\r\n", 

720 (long) sbuf.st_size + ilen); 

721 hep += strlen(hcp); 

722 strcpy (hcp, "Content-Type: application/ipp\r\n"); 

723 hep += strlen (hcp); 

724 sprintf (hep, "Host: %s:%d\r\n", printer name, IPP PORT); 
725 hep += strlen(hcp); 

726 *hep++ = 'Mr'; 

727 *hep++ = '\n'; 

728 hlen = hep - hbuf; 





[700-712] 推荐 使 用 requesting-user-name 属 性 ， 但 不 是 必需 的 。job-name 属 性 也 
是 可 选 的 。print 命 令 发 送 要 打印 的 文件 名 作为 作业 名 ， 该 名 字 能 够 帮助 用 户 区 
别 多 个 要 处 理 的 作业 。 所 提供 的 最 后 一 个 属性 是 document-format。 如 果 省 
略 该 属性 ， 则 假定 文件 格式 是 打印 机 默认 格式 。 对 于 PostScript 打 印 机 ， 格 式 可 
能 是 PostScript， 但 是 一 些 打印 机 可 以 自动 检测 格式 并 在 PostScript 与 文本 或 
PostScript 与 PCL (HP 的 Printer Command Language) 格式 间 做 选择 。 如 果 设 置 
了 PR_TEXT 标 志 ， 则 将 文档 格式 指定 为 Lext/plain， 否则 ， 设 置 为 
application/postscript。 然 后 在 属性 结束 处 用 属性 结束 标志 定 界 并 计算 
IPP 首 部 的 大 小 。 

[713-728] 现在 既然 知道 了 IPP 首 部 的 大 小 ， 就 可 以 建立 HTTP 首 部 。 将 Context-Length 
设 为 IPP 首 部 的 字 节 大 小 加 上 要 打印 文件 的 字 节 大 小 。content-Type 为 
application/ipp。 用 回 车 换行 符 结束 HTTP 首 部 。 








798 
729 /* 
730 * Write the headers first. Then send the file. 
731 */ 
732 iov[0] .iov_base = hbuf; 
733 iov[0].iov len = hilen; 
734 iov [1] .iov base = ibuf; 
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735 iov[1].iov len = ilen; 

736 if ((nw = writev(sockfd, iov, 2)) !- hlen + ilen) { 
737 log_ret ("can't write to printer"); 

738 goto defer; 

739 ) 

740 while ((nr = read(fd, buf, IOBUFSZ)) > 0) { 

741 if ((nw = write(sockfd, buf, nr)) != nr) { 

742 if (nw « 0) 

743 log ret("can't write to printer"); 

744 else 

745 log msg("short write (%d/%d) to printer", nw, nr); 
746 goto defer; 

747 ) 

748 ) 

749 if (nr « 0) { 

750 log_ret ("can’t read %s", name); 

751 goto defer; 

752 } 

753 /* 

754 * Read the response from the printer. 

755 */ 

756 if (printer_status(sockfd, jp)) { 

757 unlink (name) ; 

758 sprintf (name, "$s/*5/$1d", SPOOLDIR, REQDIR, jp->jobid) ; 
759 unlink (name) ; 

760 free (jp); 

761 jp = NULL; 

762 ) 





~J 


[729-739] 将 iovec 数 组 的 第 一 个 元 素 设 为 指向 HTTP 首 部 ， 第 二 个 指向 IPP 首 部 。 然 后 使 
用 writev 将 两 个 首部 送 往 打 印 机 。 如 果 写 失败 ， 记 录 日 志 并 跳 转 到 aefer， 
在 那里 清理 并 延迟 一 段 时 间 然 后 再 尝试 。 

[740-752] 接 下 来 ， 将 数据 文件 发 往 打印 机 。 把 数据 文件 读 和 人 IOBUFSz 缓 冲 区 块 并 写 入 与 
打印 机 相连 的 套 接 字 。 如 果 read 或 write 失 败 ， 记 录 日 志 然 后 跳 转 到 defer。 

[753-762] 当 整 个 文件 发 往 打 印 机 后 ， 调 用 printer_status 来 接收 打印 机 发 回 的 对 于 打 
印 请 求 的 响应 。 如 果 printer_status 成 功 ， 返 回 一 个 正 值 ， 删 除数 据 和 控制 
文件 。 然 后 释放 job 结构 ， 将 其 指针 设 为 NULL， 并 到 达 aefer 标 签 。 








763 defer: 


764 close (fd); 

765 if (sockfd >= 0) 

766 close (sockfq) ; 

767 if (jp != NULL) { 

768 replace_job(jp); 

769 sleep (60); 

770 } 

771 ) 

772 } 

773 /* 

774 * Read data from the printer, possibly increasing the buffer. 
775 * Returns offset of end of data in buffer or -1 on failure. 
776 * 

777 * LOCKING: none. 

778 */ 


779 ssize t 
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780 re 
781 { 
782 

783 

784 


785 
786 
787 
788 
789 
790 
791 
792 
793 
794 
795 
796. } 


[763-772] 


[773-796] 


797 /* 
798 * 
799 * 
800 * 
801 * 
802 * 
803 in 
804 pr 
805 { 
806 

807 

808 

809 

810 

811 


812 
813 
814 
815 
816 
817 
818 
819 
820 


821 
822 


215 i& 代码 641 





admore(int sockfd, char **bpp, int off, int *bszp) 


Ssize t nr; 
char *bp 
int bsz 


*bpp; 

*bszp; 

if (off >= bsz) { 
bsz += IOBUFSZ; 


if ((bp = realloc(*bpp, bsz)) == NULL) 

log_sys("readmore: can’t allocate bigger read buffer"); 
*bszp = bsz; 
*bpp = bp; 


} 

if ((mr = tread(sockfd, &bploff], bsz-off, 1)) > 0) 
return (off+nr) ; 

else 
return(-1); 


在 aefer 标 签 处 ， 关 闭 打 开 的 数据 文件 的 文件 描述 符 。 如 果 套 接 字 描述 符 是 有 
效 的 ， 则 关闭 之 。 如 果 出 错 ， 将 作业 放 回 挂 起 的 作业 列表 的 头 部 ， 然 后 延迟 1 分 
钟 。 如 果 成 功 ，jp 为 NULL ， 因 此 简单 地 回 到 循环 开始 处 ， 以 获得 下 一 个 要 打 
印 的 作业 。 

readmore 函 数 用 于 读 取 来 自打 印 机 的 部 分 响应 消息 。 如 果 到 达 缓 冲 区 尾部 ， 
通过 相应 的 参数 bppp 和 bszp 重 新 分 配 一 个 大 一 点 的 缓冲 区 并 返回 该 新 的 缓冲 区 
的 起 始 地 址 以 及 缓冲 区 大 小 。 上 述 任何 一 种 情况 下 ， 从 缓冲 区 已 读数 据 的 末尾 
开始 读 取 缓 冲 区 所 能 容纳 的 尽 可 能 多 的 数据 。 返 回 相 应 的 已 读数 据 末 尾 的 新 偏 
移 量 。 如 果 read 失 败 ， 或 者 超时 ,返回 --1。 


Read and parse the response from the printer. Return 1 
if the request was successful, and 0 otherwise. 
LOCKING: none. 

/ 

t 

inter status(int sockfd, struct job *jp) 

int i, success, code, len, found, bufsz; 
long jobid; 

ssize t nr; 

char *statcode, *reason, *cp, *contentlen; 
struct ipp hdr *hp; 

char *bp; 

/* 


* Read the HTTP header followed by the IPP response header. 
* They can be returned in multiple read attempts. Use the 
* Content-Length specifier to determine how much to read. 
*/ 

success = 0; 

bufsz = IOBUFSZ; 

if ((bp = malloc(IOBUFSZ)) == NULL) 

log sys("printer status: can't allocate read buffer"); 


while ((nr = tread(sockfd, bp, IOBUFSZ, 5)) > 0) { 
/* 


bbs.theithome.com 





oo 





642 第 21 章 与 网 络 打印 机 通信 


823 * Find the status. Response starts with "HTTP/x.y" 
824 * go we can skip the first 8 characters. 

825 */ 

826 cp = bp + 8; 

827 while (isspace( (int) *cp)) 

828 Cpt+; 

829 statcode = cp; 

830 while (isdigit((int)*cp)) 

831 cp++; 

832 if (cp == statcode) { /* Bad format; log it and move on */ 
833 log_msg (bp) ; 





[797-811] printer_status 国 数 读 取 打 印 机 对 一 个 打印 作业 请 求 的 响应 销 息 。 不 知道 打 
印 机 会 如 何 响 应 :也 许 会 在 多 个 报 文 里 回 送 一 个 响应 ， 也 许 在 一 个 报 文 里 回 送 
完整 的 响应 ;或 者 包括 一 个 中 间 确 认 ， 如 HTTP 100 Continue 报 文 。 需 要 处 
理 所 有 的 可 能 性 。 

[812-833] 分 配 一 个 缓冲 区 并 读 取 来 自打 印 机 的 数据 ， 期 望 5 秒 之 内 有 可 用 的 响应 。 跳 过 
HTTP/1 .1 和 报 文 开始 的 所 有 空格 ， 鞭 后 应 该 是 数字 的 状态 码 。 如 果 不 是 ， 在 


日 志 中 记录 报 文 的 内 容 。 
834 } else { 
835 *cpe = 'NO'; 
836 reason - Cp; 
837 while (*cp != 'Nr' && *cp != ‘\n') 
838 Cp++; 
839 *cp = 'N0'; 
840 code - atoi(statcode); 
841 if (HTTP INFO(code)) 
842 continue; 
843 if (!HTTP SUCCESS(code)) { /* probable error: log it */ 
844 bp[nr] = 'N0'; 
845 log msg("error: $5", reason); 
846 break; 
847 ) 
848 /* 
849 * The HTTP request was okay, but we still 
850 * need to check the IPP status. First 
851 * gearch for the Content-Length specifier. 
852 */ 
853 i = cp - bp; 
854 for (;;) { 
855 while (*cp != 'C' && *cp !- 'c' && i < nr) { 
856 Cp++; 
857 i++; 
858 } 
859 if (i >= nr && /* get more header */ 
860 ((nr = readmore(sockfd, &bp, i, &bufsz)) < 0)) 
861 goto out; 
862 cp = &bplil; 


[834-839] 如 果 在 响应 中 找到 一 个 数字 状态 码 ， 将 其 开始 的 非 数 字 字 符 转 换 成 空 字 节 仆 0 。 


其 后 应 该 跟随 一 个 表明 出 错 原因 的 字符 串 (文本 消息 )。 搜 索 回 车 或 换行 符 ， 并 
采用 空 字 节 八 0' 结 束 文本 字符 串 。 
[840-847] 将 代码 转换 为 整数 。 如 果 仅 是 提供 信息 的 报 文 ， 将 其 忽略 并 继续 循环 。 期 望 看 


bbs.theithome.com 











[848-862] 


863 
864 
865 
866 
867 
868 
869 
870 
871 
872 
873 
874 
875 
876 
877 
878 
879 
880 
881 
882 


883 
884 
885 
886 
887 
888 
889 
890 
891 
892 
893 
894 
895 
896 
897 
898 
899 
900 


[863-882] 


[883-900] 


21.5 i& 代码 643 


到 要 么 是 一 个 成 功 消息 要 么 是 一 个 出 错 消 息 。 如 果 得 到 一 个 出 错 消息 ， 记 录 出 
错 日 志 并 退出 循环 。 

如 果 HTTP 请 求 成 功 ， 需 要 检查 IPP 状 态 。 搜 索 整 个 报 文 直到 找到 Content- 
Length 属 性 ， 然 后 查看 c 或 <。HTTP 首 部 的 关键 字 是 大 小 写 敏感 的 ， 因 此 需要 
同时 检查 小 写字 符 和 大 写字 符 。 

如 果 缓 冲 区 空间 耗 尽 ， 需 要 再 次 读 。 既 然 Treadmore 调 用 realloc， 可 能 会 改 
变 缓冲 区 的 地 址 ， 需 要 重 置 cp 以 指向 缓冲 区 合适 的 地 方 。 


if (strncasecmp(cp, "Content-Length:", 15) == 0) { 
cp += 15; 
while (isspace( (int) *cp)) 


Cpt++; 
contentlen = cp; 
while (isdigit ( (int) *cp) ) 


Cp+t; 
*cpe = 'NO'; 
i = cp - bp; 
len = atoi(contentlen) ; 
break; 
} else { 
Cp; 


i++; 
} 
} 
if (i >= nr && /* get more header */ 
((nr = readmore (sockfd, &bp, i, &bufsz)) < 0)) 


goto out; 
cp = &bp[i]; 


found = 0; 
while (!found) { /* look for end of HTTP header */ 
while (i < nr - 2) { 
if (*cp == ‘\n' && *(cp + 1) == '\r' && 
* (cp + 2) == ‘\n’) { 
found = 1; 
cp += 3; 
i += 3; 
break; 
} 
Cp++; 
i++; 
} 
if (i >= nr && /* get more header */ 
((nr = readmore(sockfd, &bp, i, &bufsz)) < 0)) 
goto out; 
cp = &bp[i]; 


一 


如 果 找 到 Content-Length 属 性 字符 串 ， 搜 索 其 值 。 将 这 个 数字 字符 串 转 换 成 
整数 ， 并 退出 for 循 环 ， 如 果 耗 尽 缓 冲 区 那么 从 打印 机 再 次 读 取 。 如 果 到 达 缓 
冲 区 尾 也 没有 找到 Content -Length 属 性 ， 继 续 循环 并 从 打印 机 处 再 次 读 取 。 

一 旦 获得 Content-Length 所 指定 的 报 文 长 度 ， 搜 索 HTTP 首 部 的 结束 部 分 
(一 个 空白 行 )。 如 果 找 到 ， 则 设置 foung 标 志 并 跳 过 报 文中 的 空白 行 。 
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901 if (mr - i < len && /* get more header */ 

902 ((nr = readmore(sockfd, &bp, i, &bufsz)) « 0)) 
903 goto out; 

904 cp = &bpl(il; 

905 hp = (struct ipp_hdr *)cp; 

906 i = ntohs (hp->status) ; 

907 jobid = ntohl(hp-»request id); 

908 if (jobid != jp->jobid) { 

909 /* 

910 * Different jobs. Ignore it. 

911 */ 

912 log msg("jobid $1d status code %d", jobid, i); 
913 break; 

914 ) 

915 if (STATCLASS OK(i)) 

916 Success - 1; 

917 break; 

918 } 

919 } 

920 out: 

921 free (bp); 

922 if (nr < 0) { 

923 log_msg("jobid tld: error reading printer response: $s", 
924 jobid, strerror(errno)); 

925 ) 

926 return (success) ; 

927 


[901-904] 继续 搜索 HTTP 首 部 的 结尾 。 如 果 耗 尽 缓冲 区 空间 ， 再 次 读 取 。 如 果 找 到 HTTP 
首部 的 结尾 ， 计 算 HTTP 首 部 所 用 的 字 节 数 。 如 果 所 读 取 的 数据 大 小 减 去 HTTP 
首部 的 大 小 后 不 等 于 IPP 报 文 的 数据 长 度 (该 值 从 内 容 长 度 Content-Length 
中 计算 ) ， 就 需要 再 次 读 取 。 

[905-927] 从 报 文 IPP 首 部 中 获取 状态 和 作业 ID。 两 者 均 以 网 络 字 节 序 的 整数 形式 存储 ， 
因此 需要 调用 ntohs 和 ntohl 将 其 转换 为 主机 字 节 序 。 如 果 作 业 ID 不 匹配 ， 
表明 并 非 这 里 的 响应 ， 因 此 记录 日 志 并 退出 外 部 while 循 环 。 如 果 IPP 指 示 为 
成 功 状 态 ， 保 存 返 回 值 并 退出 循环 。 如 果 打 印 请 求 成 功 返 回 1， 如 果 失 败 则 返 
回 0。 

这 里 总 结 本 章 中 这 个 扩展 的 例子 。 本 章 中 的 程序 在 Xerox Phaser 860 网 络 PostScript 打 印 机 

上 测试 。 遗 憾 的 是 ， 这 种 打印 机 不 能 识别 Lext/plain 文 档 格 式 ， 但 是 确实 能 够 自动 检查 文本 
和 PostScript。 因 此 ， 这 种 打印 机 上 可 以 打印 PostScript 文 件 和 文本 文件 ， 但 是 不 能 按照 文本 那样 
打印 PostScript 源 文件 ， 除 非 使 用 另外 的 工具 (如 a2ps(1)) 来 封装 PostScript 程 序 。 


21.6 小 结 


本 章 仔细 考查 了 两 个 完整 的 程序 : 一 个 打印 假 脱 机 守护 进程 ， 可 以 将 打印 作业 发 送 到 网 络 
打印 机 ， 一 个 命令 行程 序 ， 将 要 打印 的 作业 提交 到 假 脱 机 守护 进程 。 这 提供 了 一 个 机 会 ， 考 查 
在 一 个 实际 程序 中 使 用 前 面 章节 所 讲述 的 许多 特性 ， 例 如 ， 线程 、IMO 多 路 技术 、 文 件 O、 套 
接 字 IO 及 信号 。 


bbs.theithome.com 








21.6 小 结 645 


习题 


21.1 


21.2 


21.3 


21.4 


21.5 
21.6 


将 ipp .h 中 所 列 的 IPP 错 误 代 码 值 转换 成 错误 消息 。 然 后 修改 打印 假 脱 机 守护 进程 ， 当 
IPP 首 部 指示 有 打印 机 错误 上 时， 在 printer_status 函 数 结尾 处 记录 日 志 。 

增强 print 命 令 和 printd 守 护 进程 ， 使 得 用 户 可 以 请 求 双 面 打印 。 同 样 ， 使 其 可 以 支持 
横向 打印 和 纵向 打印 。 

修改 打印 假 脱 机 守护 进程 ， 使 得 当 其 开始 时 ， 能 够 联系 打印 机 并 找 出 打印 机 所 支持 的 特 
性 ， 这 样 守护 进程 就 不 会 请 求 打印 机 所 不 支持 的 选项 。 

写 一 个 命令 行程 序 来 报告 挂 起 的 打印 作业 状态 。 

写 一 个 命令 行程 序 来 取消 一 个 挂 起 的 打印 作业 。 

在 打印 假 脱 机 守护 进程 中 支持 多 个 打印 机 ， 并 包括 将 打印 作业 从 一 个 打印 机 移 到 另 一 个 
打印 机 的 方式 。 
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本 附录 包含 了 正文 中 描述 过 的 标准 ISO C、POSIX 和 UNIX 系 统 函 数 的 函数 原型 。 通 常 我 们 
想 了 解 的 只 是 函数 的 参数 (fgets 的 哪 一 个 参数 是 文件 指针 ? ) 或 者 返回 值 (sprintf 返 回 的 
是 指针 还 是 计数 值 ?) 。 这 些 函 数 原型 还 说 明了 要 包含 哪些 头 文件 ， 以 获得 特殊 常量 的 定义 ， 
或 获得 ISO C 函 数 原型 ， 以 帮助 检测 编译 时 错误 。 

引用 每 个 函数 原型 的 页 号 出 现在 为 该 函数 列 出 的 第 一 个 头 文件 的 右边 ， 这 个 页 号 指 的 是 包 
含 该 函数 原型 的 页 。 为 获得 该 函数 原型 的 附加 信息 可 参阅 该 页 。 

某 些 函 数 原型 仅 受 本 书 描述 的 几 种 平台 中 某 几 种 的 支持 。 另 外 ， 某 些 函 数 标志 是 有 些 平台 
支持 而 另 一 些 平台 并 不 支持 的 。 对 于 这 些 情况 ， 我 们 通常 列 出 提供 支持 的 平台 ， 但 是 对 于 少数 
情况 ， 我 们 列 出 了 不 提供 支持 的 平台 。 


void abort (void) ; 
<stdlib.h> p.274 
此 函数 不 返回 


int accept (int sockfd, struct sockaddr *restrict addr, 
Socklen t *restrict len); 


<sys/socket .h> p.451 
返回 值 : 若 成 功 则 返回 文件 〈 套 接 字 ) 描述 符 ， 若 出 错 则 返回 -1 


int access (const char *pathname, int mode); 
«unistd.h» p.78 
mode: R OK, W OK, X OK, F OK 
返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 -1 

unsigned 

int alarm(unsigned int seconds) ; 
<unistd.h> p.252 
返回 值 : ORANE ERE t REST AIA BPR 


char *asctime(const struct tm *tmptr); 
«time.h» p.144 
返回 值 : 指向 以 null 结 尾 的 字符 串 的 指针 


int atexit (void (*func) (void) ); 
<stdlib.h> p.149 
BA: 车 成 功 则 返回 0， 若 出 错 则 返回 非 0 值 


int bind (int sockfd, const struct sockaddr *addr, socklen t len); 


<sys/socket .h> p.449 
返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 ~1 


void *calloc(size t nobj, size t size); 


<stdlib.h> p.155 
返回 值 : 若 成 功 则 返回 非 空 指针 ， 若 出 错 则 返回 NULL 
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Speed t cfgetispeed (const struct termios *lermptr); 
«termios.h» p.523 


返回 值 ， 波 特 率 值 


speed t cfgetospeed(const struct termios *termptr); 
<termios.h> p.523 


返回 值 : WERE 


int cfsetispeed (struct termios *termptr, speed t speed) ; 
«termios.h» p.523 


BAL: 车 成 功 则 返回 0， 若 出 错 则 返回 -1 


int cfsetospeed (struct termios *termptr, speed t speed); 
«termios.h» p.523 


AME: 车 成 功 则 返回 0， 若 出 错 则 返回 ~1! 


int chdir(const char *pathname) ; 


<unistd.h> p.102 
返回 值 : 车 成 功 则 返回 9， 若 出 错 则 返回 -1 


int chmod(const char *pathname, mode t mode); 


«sys/stat.h» p.81 
mode: S IS(UGl]ID, S ISVTX, S I[RWX] (USR|GRP|OTH) 


返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 ~1 


int chown (const char *pathname, uid t owner, già t group); 
«unistd.h» p.84 
BE: 车 成 功 则 返回 0， 若 出 错 则 返回 一 1 
void cleererr (FILE *fp); 
<stdio.h> p.115 
int close(int filedes) ; 
«unistd.h» p.50 
返回 值 ， 若 成 功 则 返回 9， 若 出 错 则 返回 一 1 
int closedir (DIR *dp); 
«dirent.h» p.98 
返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 -1! 
void Closelog (void); 
«By8log.h» p.346 
unsigned 
char *CM8G DATA(struct cmsghdr *cp); 
<sys/socket .h> p.487 
返回 值 : 指向 与 cmsghar 结 构 相 关联 的 数据 的 指针 
struct 
cmsghdr  *CM8G FIRSTHDR(struct msghdr *mp); 
<sys/socket .h> p.487 
返回 值 ， 指 向 与 msghar 结 构 相关 联 的 第 一 个 cmsghar 结 构 的 指针 ， 若 无 这 样 的 结构 
则 返回 NULL 
unsigned 
int CMSG_LEN(unsigned int nbytes); 
<sys/socket .h> p.487 
返回 值 : 为 mbytes 大 小 的 数据 对 象 分 配 的 长 度 
struct 


cmeghdr  *CMBG NXTHDR(struct msghdr *mp, struct cmsghdr *cp); 
<sys/socket .h> p.487 
返回 值 : 指向 与 msghdr 结 构 相 关联 的 下 一 个 cmsghar 结 构 的 指针 ， 读 msghdr 结 构 
给 出 了 当前 cmsghar 结 构 ， 车 当前 cmsghar 结 构 已 是 最 后 一 个 则 返回 NULL 
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char 
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int 
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void 


void 


void 


void 


void 


void 


void 


int 


int 


int 


connect (int sockfd, const struct sockaddr *addr, socklen t len); 
<sys/socket .h> p.450 
返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 -1 


creat(const char *pathname, mode t mode); 


«fentl.h» p.50 
mode: S IS[UG]ID, S ISVTX, S I[RWX] (USR|GRP | OTH) 


返回 值 : 车 成 功 则 返回 为 只 写 打 开 的 文件 描述 符 ， 若 出 错 则 返回 -1 
*ctermid(char *ptr) ; 

<stdio.h> p.524 

返回 值 ， 若 成 功 则 返回 指向 控制 终端 名 的 指针 ， 若 出 错 则 返回 指向 空 字符 申 的 指针 


*ctime(const time t *calptr) ; 


«time.h» p.144 
返回 值 ， 指向 以 null 结 尾 的 字符 申 的 指针 

dup (int filedes) ; 
<unistd.h> p.60 


返回 值 : 车 成 功 则 返回 新 的 文件 描述 符 ， 若 出 错 则 返回 -1 


dup2 (int filedes, int filedes2) ; 
<unistd.h> p.60 
返回 值 : 车 成 功 则 返回 新 的 文件 描述 符 ， 若 出 错 则 返回 -1 


endgrent (void) ; 
<grp.h> p.137 


endhostent (void) ; 
<netdb.h> p.443 


endnetent (void); 
«netdb.h» p.443 


endprotoent (void); 
<netdb.h> p.444 


endpwent (void); 5 
«pwd.h» p.135 


endservent (void); 


«netdb.h» p.444 
endspent (void); 
<shadow.h> p.137 
平台 : Linux 24.22, Solaris 9 
execl(const char *pathname, const char *argÜ, ... /* (char *) 0 */ ); 
«unistd.h» p.188 
返回 值 : 车 出 错 则 返回 ~1， 车 成 功 则 不 返回 值 
execle(const char *pathname, const char *argü, ... /* (char *) 0, 
char *const envp[] */ ); 
«unistd.h» p.188 
BE: 车 出 错 则 返回 -1， 若 成 功 则 不 返回 值 
execlp(const char *filename, const char *argÜ, ... /* (char *) 0 */ ); 
<unistd.h> p.188 


返回 值 : 车 出 错 则 返回 -1， 若 成 功 则 不 返回 值 
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execv(const char *pathname, char *const argv[]); 
<unistd.h> 


返回 值 : 若 出 错 则 返回 -1， 若 成 功 则 不 返回 值 


execve(const char * pathname , char *const argv[], char *const envp[]); 
<unistd.h> 


BE: 若 出 错 则 返回 -1， 若 成 功 则 不 返回 值 


execvp(const char ‘filename, char *const argv(]); 
<unistd.h> 


返回 值 : 若 出 错 则 返回 -1， 若 成 功 则 不 返回 值 


.Exit(int status); 
<stdlib.h> 
此 函数 不 返回 


exit (int status); 
<unistd.h> 
此 函数 不 返回 


exit(int status) ; 
<stdlib.h> 
此 函数 不 返回 


fattach(int filedes, const char *path) ; 
<stropts.h> 


返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 -1 
平台 : Linux 2.4.22，Solaris 9 


fchdir (int filedes) ; 
<unistd.h> 


BEE: 车 成 功 则 返回 0， 若 出 错 则 返回 -1 


fchmod (int filedes, mode_t mode) ; 
<sys/stat .h> 
mode: S IS[UG]ID, S ISVTX, S_I [RWX] (USR|GRP|OTH) 
返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 -1 


fchown (int filedes, uid t owner, gid t group) ; 
<unistd.h> 


返回 值 : 若 成 功 则 返回 0， 若 出 错 则 返回 -1 


fclose(FILE *fp); 
<stdio.h> 
返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 EOF 


fcntl(int filedes, int cmd, ... /* int arg */ ); 
«fcntl.h» 
cmd: F DUPFD, F GETFD, F SETFD, F GETFL, F SETFL, 
F GETOWN, F SETOWN, F GETLK, F SETLK, F SETLKW 


返回 值 :车 成 功 则 依赖 于 cmd， 若 出 错 则 返回 -1 


fdatasync(int filedes) ; 
<unistd.h> 
BA: 车 成 功 则 返回 0， 若 出 错 则 返回 -1 
平台 : Linux 2.4.22, Solaris 9 
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FD_CLR (int fd, fd_set *fdset); 
<sys/select .h> 


fdetach(const char *path); 
«Btropts.h» 


BA: 车 成 功 则 返回 0， 若 出 错 则 返回 -1 
平台 : Linux 2.4.22, Solaris 9 


FD_ISSET(int fd, fd set *fdset) ; 
<sys/select .h> 


返回 值 : 车 包 在 描述 符 集中 则 返回 非 0 值 ， 否 则 返回 0 


*fdopen(int filedes, const char *type) ; 
<stdio.h> 
type: "y. "W", "a", "r+", "we, "ae", 


A: 若 成 功 则 返回 文件 指针 ， 若 出 错 则 返回 NULL 


FD 8BT(int fd, fd set *fdset) ; 
<sys/select.h> 


FD_ZERO(fd_set *fdset) ; 
<sys/select .h> 


feof (FILE *fp); 
<stdio.h> 


返回 值 : 车 在 流 上 文件 结尾 则 返回 非 0 值 ( 真 )， 否 则 返回 0 (E) 


ferror (FILE *fp); 
<stdio.h> 


返回 值 : 车 在 流 上 出 错 则 返回 非 0 值 ( 真 )， 否 则 返回 0 ( 假 ) 


fflush(FILE *fp); 
<stdio.h> 


返回 值 ， 若 成 功 则 返回 9， 若 出 错 则 返回 EOF 


fgetc (FILE *fp); 
<stdio.h> 


返回 值 : 车 成 功 则 返回 下 一 个 字符 ， 若 已 到 达 文 件 结尾 或 出 错 则 返回 PROF 


fgetpos(FILE *restrict fp, fpos t *restrict pos); 
<stdio.h> 


BEE: RIIE, Jt RUEIEOfR 


*fgets (char *restrict buf, int n, FILE *restrict fp); 
<stdio.h> 


返回 值 ， 若 成 功 则 返回 bwf， 若 已 到 达 文件 结尾 或 出 错 则 返回 NULL 


fileno(FILE *fp); 
<stdio.h> 


返回 值 ， 与 该 流 相关 联 的 文件 描述 符 


flockfile(FILE *fp); 
<stdio.h> 


*fopen(const char *restrict pathname, const char *restrict type); 
<stdio.h> 
e: "t, "gts "a", "ye", "we", "arx", 


返回 值 : 车 成 功 则 返回 文件 指针 ， 若 出 错 则 返回 NULL 
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pid_t fork (void) ; 


<unistd.h> p.172 
BAMA: 子 进程 中 返回 0， 父 进程 中 返回 子 进程 也 ， 出 错 返回 -1 


long fpathconf (int filedes, int name); 


<unistd.h> p.33 
name: PC ASYNC IO, PC CHOWN RESTRICTED, 

_PC_FILESIZEBITS, PC LINK MAX, PC MAX CANON, 

PC MAX INPUT, PC NAME MAX, PC NO TRUNC, 

_PC PATH MAX, 'u' PC PIPE BUF, PC PRIO IO, 

PC SYNC 10, PC SYMLINK MAX, PC VDISABLE 


返回 值 ， 若 成 功 则 返回 相应 值 ， 若 出 错 则 返回 一 1 


int fprintf (FILE *restrict fp, const char *restrict format, ...); 
<stdio.h> p.121 
返回 值 ， 若 成 功 则 返回 输出 字符 数 ， 若 输出 出 错 则 返回 负 值 


int fputc(int c, FILE *fp); 
<stdio.h> p.116 
返回 值 : 若 成 功 则 返回 c， 若 出 错 则 返回 EOF 


int fputs (const char *restrict sir, FILE *restrict fp): 
<stdio.h> p-117 
返回 值 ， 若 成 功 则 返回 非 负 值 ， 若 出 错 则 返回 EOF 


size_t fread(void *restrict ptr, size t size, size t nobj, FILE *restrict fp); 
«Btdio.h» : p.119 
返回 值 : 读 的 对 象 数 


void free(void *ptr) ; 
<stdlib.h> p.155 


void freeaddrinfo (struct addrinfo *ai); 


<sys/socket .h> p.445 
«netdb.h» 


FILE *freopen(const char *restrict pathname, const char *restrict type, 
FILE *restrict fp); 


<stdio.h> p.112 
type: "y" tw", "a", "re", “wee, "a+", 


返回 值 ， 若 成 功 则 返回 文件 指针 ， 若 出 错 则 返回 NULL 


int fscanf(FILE *restrict fp, const char *restrict format, ...); 
<stdio.h> p.124 


返回 值 : 指定 的 输入 项 数 ， 若 输入 出 错 或 在 任意 变换 前 已 到 达 文 件 结尾 则 返回 EOF 


int fseek(FILE *fp, long offset, int whence); 
<stdio.h> p.120 
whence: SEEK_SET, SEEK_CUR, SEEK_END 
返回 值 : 若 成 功 则 返回 0， 若 出 错 则 返回 非 0 值 


int feeeko (FILE *fp, off t offset, int whence); 
<stdio.h> p.121 
whence: SEEK SET, SEEK CUR, SEEK END 


返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 非 0 值 
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fsetpos(FILE *fp, const fpos t *pos) ; 


<stdio.h> p.121 
返回 值 ， 若 成 功 则 返回 9， 若 出 错 则 返回 非 0 值 


fstat(int filedes, struct stat *buf); 


<sys/stat .h> p.71 
返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 一 ! 


fsync(int fides) ; 
<unistd.h> p.62 
返回 值 : 若 成 功 则 返回 0， 若 出 错 则 返回 -1 


ftell(FILE */p); 
<stdio.h> p.120 
BA: 车 成 功 则 返回 当前 文件 位 置 指示 ， 若 出 错 则 返回 一 1L 


ftello(FILE *fp); 
<stdio.h> p.121 
BA: 车 成 功 则 返回 当前 文件 位 置 指示 ， 若 出 错 则 返回 (off_t)-1 


ftok(const char *path, int id); 
«8yB/ipc.h» p.416 
返回 值 : 车 成 功 则 返回 键 ， 若 出 错 则 返回 (key t)-1 


ftruncate(int filedes, off_t length) ; 


<unistd.h> p.86 
返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 -1 


ftrylockfile (FILE *fp) ; 
<stdio.h> p.325 
返回 值 : 若 成 功 则 返回 0， 否 则 返回 非 0 值 


funlockfile(FILE *fp) ; 
<stdio.h> p.325 


fwide (FILE *fp, int mode); 


<stdio.h> p.109 

«wchar.h» 

返回 值 : 车流 是 宽 定向 的 则 返回 正 值 ， 若 流 古 字 节 定向 的 则 返回 负 值 ， 或 者 若 流 是 未 
定向 的 则 返回 0 


fwrite(const void *restrict ptr, size t size, size_t nobj, 
FILE *restrict fp); 
<stdio.h> p.119 
返回 值 : 写 的 对 象 数 


*gai strerror(int error); 
«netdb.h» p.446 
返回 值 ， 指 向 描述 错误 的 字符 申 的 指针 


getaddrinfo (const char *restrict host, const char *restrict service, 
const struct addrinfo *restrict hint, 
struct addrinfo **restrict res); 
<sys/socket .h> p.445 
«netdb.h» 


返回 值 : 车 成 功 则 返回 9， 若 出 错 则 返回 非 0 错误 码 
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struct 
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int 


getc (FILE *fp); 
<stdio.h> 


返回 值 : 车 成 功 则 返回 下 一 个 字符 ， 若 已 到 达 文 件 结尾 或 出 错 则 返回 EOF 


getchar (void) ; 
<stdio.h> 


BANE: 车 成 功 则 返回 下 一 个 字符 ， 若 已 到 达 文件 结尾 或 出 错 则 返回 EOF 


getchar unlocked (void) ; 
<stdio.h> 


返回 值 : 若 成 功 则 返回 下 一 个 字符 ， 若 已 到 达 文件 结尾 或 出 错 则 返回 BOF 


getc unlocked(FILE *fp); 
<stdio.h> 
返回 值 : 若 成 功 则 返回 下 一 个 字符 ， 若 已 到 达 文 件 结尾 或 出 错 则 返回 EOF 


*getcwd(char *buf, size t size); 

«unistd.h» 

返回 值 ， 若 成 功 则 返回 bxf， 若 出 错 则 返回 NULL 
getegid (void); 


<unistd.h> 


BEE: 调用 进程 的 有 效 组 也 


*getenv(const char *name) ; 

<stdlib.h> 

返回 值 ， 指 向 与 rame 关 联 的 volue 的 指针 ， 若 未 找到 则 返回 NULL 
geteuid (void) ; 

<unistd.h> 


返回 值 : 调用 进程 的 有 效用 户 ID 
getgid (void); 
<unistd.h> 
返回 值 : 调用 进程 的 实际 组 也 
*getgrent (void) ; 
«grp.h» 
BA: 车 成 功 则 返回 指针 ， 若 出 错 或 到 达 文 件 结尾 则 返回 NULL 


*getgrgid(gid t gid); 
«grp.h» 
返回 值 : 若 成 功 则 返回 指针 ， 若 出 错 则 返回 NULL 


*getgrnam(const char *name) ; 
«grp.h» 
返回 值 ， 若 成 功 则 返回 指针 ， 车 出 错 则 返回 NULL 


getgroups (int gidsetsize, gid t grouplist [] ) ; 
«unistd.h» 


BA: 车 成 功 则 返回 附加 组 ID 数 ， 若 出 错 则 返回 -1 


*gethostent (void) ; 
«netdb.h» 


BA: 车 成 功 则 返回 指针 ， 若 出 错 则 返回 NULL 


gethostname(char *name, int namelen); 
«unistd.h» 


返回 值 ， 若 成 功 则 返回 9， 车 出 错 则 返回 一 1 
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*getlogin (void) ; 
<unistd.h> 


返回 值 ， 若 成 功 则 返回 指向 登录 名 字符 申 的 指针 ， 若 出 错 则 返回 NULL 


getmsg (int filedes, struct strbuf *restrict ctlptr, 
struct strbuf *restrict dataptr, int *restrict flagpir); 
<stropts.h> 
*flagptr: 0, RS_HIPRI 


返回 值 : 若 成 功 则 返回 非 负 值 ， 若 出 错 则 返回 -1 
平台 : Linux 24.22, Solaris 9 


getnameinfo(const struct sockaddr *restrict addr, socklen t alen, 
char *restrict host, socklen t hostlen, char *restrict service, 
Socklen t servien, unsigned int flags); 


<sys/socket .h> 
<netdb.h> 


返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 非 0 值 


*getnetbyaddr(uint32 七 met, int type); 
<netdb.h> 


返回 值 : 若 成 功 则 返回 指针 ， 若 出 错 则 返回 NULL 


*getnetbyname(const char *name) ; 
<netdb.h> 
返回 值 ， 若 成 功 则 返回 指针 ， 车 出 错 则 返回 NULL 


*getnetent (void); 
<netdb.h> 
返回 值 ， 若 成 功 则 返回 指针 ， 若 出 错 则 返回 NULL 


getopt (int argc, const * const argu], const char *options); 
«fentl.h» 
extern int optind, opterr, optopt; 
extern char *optarg; 


返回 值 : 下 一 个 选项 字符 ， 若 全 部 选项 处 理 完毕 则 返回 -1 


getpeername (int sockfd, struct sockaddr *restrict addr, 
socklen_t *restrict alenp) ; 


<sys/socket .h> 


BAA. 车 成 功 则 返回 0， 若 出 错 则 返回 -1 


getpgid(pid t pid); 
«unistd.h» 


返回 值 : 车 成 功 则 返回 进程 组 ID ， 若 出 错 则 返回 -1 


getpgrp (void); 
<unistd.h> 


返回 值 : 调用 进程 的 进程 组 也 


getpid(void); 
«unistd.h» 


返回 值 ， 调 用 进程 的 进程 ID 


getpmag (int filedes, struct strbuf *restrict ctiptr, 
struct strbuf *restrict dataptr, int *restrict bandptr, 
int *restrict flagptr) ; 
<stropts.h> 
*fiagptr: 0, MSG_HIPRI, MSG_BAND, MSG_ANY 
返回 值 : 车 成 功 则 返回 非 负 值 ， 若 出 错 则 返回 -1 
平台 : Linux 2.4.22，Solaris 9 
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struct 
protoent 


struct 
protoent 


struct 
protoent 


struct 
passwd 


struct 
passwd 


struct 
passwd 


char 


struct 
servent 


struct 
servent 


struct 
servent 


pid_t 


getppid (void); 
<unistd.h> 


返回 值 : 调用 进程 的 父 进程 ID 


*getprotobyname(const char *name) ; 
«netdb.h> 
返回 值 ， 若 成 功 则 返回 指针 ， 若 出 错 则 返回 NULL 


*getprotobynumber (int proto); 


<netdb.h> 
返回 值 : 若 成 功 则 返回 指针 ， 若 出 错 则 返回 NULL 


*getprotoent (void) ; 


«netdb.h- 
返回 值 ， 若 成 功 则 返回 指针 ， 若 出 错 则 返回 NULL 


*getpwent (void) ; 
«pwd.h» 
返回 值 ， 若 成 功 则 返回 指针 ， 若 出 错 或 到 达 文 件 结尾 则 返回 NULL 


*getpwnam(const char *name) ; 
«pwd.h» 
返回 值 : 若 成 功 则 返回 指针 ， 若 出 错 则 返回 NULL 


*getpwuid(uid t uid); 
<pwd.h> 
返回 值 ， 若 成 功 则 返回 指针 ， 若 出 错 则 返回 NULL 


getrlimit (int resource, struct rlimit *rlptr) ; 
«8ys/resource.h» 


返回 值 ， 若 成 功 则 返回 9， 若 出 错 则 返回 非 0 值 


*gets (char *buf); 
<stdio.h> 


返回 值 ， 若 成 功 则 返回 buf， 若 已 到 达 文 件 结尾 或 出 错 则 返回 NULL 


*getservbyname(const char *name, const char *proto) ; 
«netdb.h- 
返回 值 : 若 成 功 则 返回 指针 ， 若 出 错 则 返回 NULL 


*getservbyport (int port, const char *proto); 
«netdb.h» : 
返回 值 ， 若 成 功 则 返回 指针 ， 若 出 错 则 返回 NULL 


*getservent (void); 
«netdb.h» 
返回 值 ， 若 成 功 则 返回 指针 ， 若 出 错 则 返回 NULL 


getsid(pid t pid); 
«unistd.h» 


返回 值 : 车 成 功 则 返回 会 话 首 进 程 的 进程 组 ID ， 若 出 错 则 返回 ~1 


getsockname(int sockfd, struct sockaddr *restrict addr, 
socklen_t *restrict alenp) ; 
<sys/socket .h> 


返回 值 ， 车 成 功 则 返回 9， 若 出 错 则 返回 -1 
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getsockopt (int sockfd, int level, int option, void *restrict val, 


socklen_t *restrict lenp); 
«Sys/socket.h» 


返回 值 : 若 成 功 则 返回 9， 车 出 错 则 返回 ~1 


*getspent (void); 
<shadow.h> 


返回 值 ， 若 成 功 则 返回 指针 ， 若 出 错 则 返回 NULL 
平台 : Linux 2.4.22，Solaris 9 


*getspnam(const char *name); 
<shadow.h> 


返回 值 ; 车 成 功 则 返回 指针 ， 若 出 错 则 返回 NULL 
平台 : Linux 2.4.22, Solaris 9 


p.465 


p.137 


p.137 


gettimeofday(struct timeval *restrict tp, void *restrict izp); 


<sys/time.h> 


返回 值 : 总 是 返回 0 


getuid (void) ; 


<unistd.h> 


返回 值 : 调用 进程 的 实际 用 户 ID 


*gmtime(const time t *calptr) ; 
«time.h» 


返回 值 : 指向 tm 结构 的 指针 


grentpt (int filedes) ; 
<stdlib.h> 
BEHE: 车 成 功 则 返回 0， 若 出 错 则 返回 -1 
324, FreeBSD 5.2.1, Linux 2.4.22，Solaris 9 


uint32 t htonl(uint32_t hostint32) ; 


«arpa/inet.h» 


返回 值 ， 以 网 络 字 节 序 表示 的 32 位 整 型 数 


uintlé_t htongs (uint16 t hostintl6); 


const 
char 


int 


int 


int 


«arpa/inet.h» 


返回 值 ， 以 网 络 字 节 序 表示 的 16 位 整 型 数 


p.142 


p.172 


p.144 


p.545 


p.440 


p.440 


*inet ntop(int domain, const void *restrict addr, char *restrict str, 


Socklen t size); 
«arpa/inet.h» 


p.442 


返回 值 : 车 成 功 则 返回 地 址 字符 串 指针 ， 若 出 错 则 返回 NULL 


inet pton(int domain, const char *restrict str, void 
«arpa/inet.h» 


*restrict addr); 


返回 值 : 车 成 功 则 返回 1， 若 格式 无 效 则 返回 0， 若 出 错 则 返回 ~1 


initgroups(const char *username, gid t basegid) ; 


<grp.h> /* Linux & Solaris */ 
<unistd.h> /* FreeBSD & Mac OS X */ 


返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 ~1 


ioctl (int filedes, int request, ...); 


<unistd.h> /* System V */ 
<sys/ioctl.h> /* BSD and Linux */ 
<stropts.h> /* XSI STREAMS */ 


返回 值 : 车 出 错 则 返回 ~1， 若 成 功 则 返回 其 他 值 
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int isastream(int filedes) ; 
«stropts.h» 


返回 值 : 若 为 STREAMS 设 备 则 返回 1 ( 真 )， 否 则 返回 0 ( 假 ) 
平台 ，Linux 2.4.22，Solaris 9 


int igatty (int filedes) ; 
<unistd.h> 


返回 值 ， 若 为 终端 设备 则 返回 1 ( 真 )， 否 则 返回 0 〈 假 ) 


int kill (pid t pid, int signo); 
<signal.h> 


返回 值 ， 若 成 功 则 返回 9， 车 出 错 则 返回 一 1 


int lchown(const char *pathname, uid t owner, gid t group); 
«unistd.h» 


返回 值 ， 若 成 功 则 返回 9?， 若 出 错 则 返回 -1 


int link(const char *existingpath, const char *newpath) ; 
<unistd.h> 


REHE: 若 成 功 则 返回 9， 若 出 错 则 返回 一 1 


int listen(int sockfd, int backlog) ; 

<sys/socket .h> 

返回 值 ， 若 成 功 则 返回 9， 若 出 错 则 返回 一 1 
struct 
tm *localtime(const time t *calptr) ; 


«time.h» 


返回 值 : 指向 tm 结构 的 指针 


void longjmp(jmp buf env, int val); 
«setjmp.h» 


此 函数 不 返回 


off 上 lseek(int filedes, off t offset, int whence); 
«unistd.h» 
whence: SEEK SET, SEEK CUR, SEEK END 
返回 值 ， 若 成 功 则 返回 新 的 文件 偏 移 量 ， 若 出 错 则 返回 一 1 


int lstat(const char *restrict pathname, struct stat *restrict buf); 
<sys/stat.h> 
返回 值 : 车 成 功 则 返回 9， 若 出 错 则 返回 ~1 

void *malloc(size_t size) ; 


<stdlib.h> 
返回 值 : 车 成 功 则 返回 非 空 指针 ， 若 出 错 则 返回 ROLL 


int mkdir(const char ‘pathname, mode t mode); 
«Sys/stat.h» 
mode: S_IS(UGIID, S ISVTX, S I(RWX] (USR|GRP|OTH) 
返回 值 : 若 成 功 则 返回 0， 若 出 错 则 返回 -1 

int mkfifo(const char *pathname, mode t mode); 


<sys/stat.h> 
mode: S_IS{UG]ID, S_ISVTX, S I[RWX] (USR|GRP|OTH) 


返回 值 : 若 成 功 则 返回 9， 若 出 错 则 返回 -1 


int mkstemp (char *template) ; 
<stdlib.h> 
返回 值 : AAR ART. AHE -1 
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time_t mktime(struct tm *tmptr) ; 
< 上 ime .h> p.144 
返回 值 : 车 成 功 则 返回 日 历时 间 ， 若 出 错 则 返回 ~! 
caddr t *mmap (void *addr, size t len, int prot, int flag, int filedes, off t off); 
<sys/mman.h> p.391 
prot: PROT READ, PROT WRITE, PROT EXEC, PROT NONE 
flag: MAP FIXED, MAP SHARED, MAP PRIVATE 
返回 值 ， 若 成 功 则 返回 映射 区 的 起 始 地 址 ， 若 出 错 则 返回 MAP_FAILED 
int mprotect (void *addr, size t len, int prot); 
<sys/mman.h> p-393 
返回 值 : 若 成 功 则 返回 0， 若 出 错 则 返回 -1 
int magetl (int msgid, int cmd, struct msgid ds *buf); 
<sys/msg.h> p.420 
cmd: IPC STAT, IPC SET, IPC RMID 
返回 值 ， 若 成 功 则 返回 9， 若 出 错 则 返回 -1 
平台 : FreeBSD 5.2.1, Linux 2422, Solaris 9 
int magget(key t key, int flag); 
<sys/msg.h> p.419 
flag: 0, IPC CREAT, IPC EXCL 
返回 值 : 车 成 功 则 返回 消息 队列 ID ， 若 出 错 则 返回 -1 
324, FreeBSD 5.2.1, Linux 2.4.22, Solaris 9 
Ssize t magrev(int msgid, void *ptr, size t nbytes, long type, int flag); 
«8ys/msg.h» p.421 
flag: 0, IPC NOWAIT, MSG NOERROR 
返回 值 ， 若 成 功 则 返回 消息 的 数据 部 分 的 长 度 ， 若 出 错 则 返回 -~1 
平台 ; FreeBSD 5.2.1, Linux 2.4.22, Solaris 9 
int msgsnd(int msgid, const void *pir, size t nbytes, int flag); 
<sys/msg.h> p.420 
flag: 0, IPC_NOWAIT 
返回 值 ， 车 成 功 则 返回 0， 若 出 错 则 返回 -1 
平台 ，FreeBSD 52.1, Linux 2.4.22, Solaris 9 
int maync (void *addr, size t len, int flags); 
<sys/mman.h> p.393 
返回 值 ， 若 成 功 则 返回 9?， 若 出 错 则 返回 -1 
int munmap(caddr t addr, size t len); 
«sys/mman.h» p.393 
返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 -1 
uint32 t ntohl(uint32 t netint32) ; 
«arpa/inet.h» p.440 
返回 值 ， 以 主机 字 节 序 表示 的 32 位 整 型 数 
uintl6 t ntohs(uintl6 t netint16); 
«arpa/inet.h» p.440 
返回 值 ， 以 主机 字 节 序 表示 的 16 位 整 型 数 
int open(const char *pathname, int oflag, ... /* mode t mode */ ); 
«fcntl.h» p.48 


oflag: O RDONLY, O WRONLY, O_RDWR; 
O APPEND, O CREAT, O DSYNC, O EXCL, O NOCTTY, 
O NONBLOCK, O RSYNC, O SYNC, O TRUNC 
mode: S IS[UG]ID, S ISVTX, S I[RWX] (USR|GRP|OTH) 
返回 值 ， 若 成 功 则 返回 文件 描述 符 ， 若 出 错 则 返回 -1 
EG: O_FSYNC 标 志 在 FreeBSD 5.2.1 和 Mac OS X 10.3 上 支持 
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*opendir(const char *pathname) ; 
«direct .h> p.98 


返回 值 : 车 成 功 则 返回 指针 ， 若 出 错 则 返回 NULL 


openlog (char *ident, int option, int facility) ; 


<syslog.h> p.346 
option: LOG_CONS, LOG_NDELAY, LOG_NOWAIT, LOG_ODELAY, 

LOG PERROR, LOG PID 
facility: LOG AUTH, LOG AUTHPRIV, LOG CRON, LOG DAEMON, 

LOG FTP, LOG KERN, LOG LOCAL[0-7], LOG LPR, 

LOG MAIL, LOG NEWS, LOG SYSLOG, LOG USER, LOG UUCP 


pathconf (const char *pathname, int name); 
«unistd.h» p.33 
name: PC ASYNC IO, PC CHOWN RESTRICTED, 
.PC FILESIZEBITS, PC LINK MAX, PC MAX CANON, 
.PC MAX INPUT, PC NAME MAX, PC NO TRUNC, 
.PC PATH MAX, PC PIPE BUF, PC PRIO IO, 
.PC SYMLINK MAX, PC SYNC IO, PC VDISABLE 
返回 值 : 车 成 功 则 返回 相应 值 ， 若 出 错 则 返回 -1 


pause (void); 


«unistd.h» p252 
返回 值 ，-1， 并 将 errno 设 置 为 EINTR 


pclose(FILE *fp); 
«stdio.h» p.403 


返回 值 : popen cmdstring 的 终止 状态 ， 若 出 错 则 返回 -1 


perror (const char *msg); 
<stdio.h> p.11 


pipe (int filedes[2]) ; 
<unistd.h> p.398 
返回 值 ， 若 成 功 则 返回 0， 若 出 错 则 返回 -1 


poll(struct pollfd fdarray(], nfds t nfds, int timeout); 
<poll .h> p.384 
返回 值 ， 准 备 就 绪 的 描述 符 数 ， 若 超时 则 返回 9， 车 出 错 则 返回 -~1 
平台 : FreeBSD 5.2.1, Linux 2.4.22，Solaris 9 

*popen (const char *cmdstring, const char *type); 


<stdio.h> p.403 
type: nyn, twit 
返回 值 ， 若 成 功 则 返回 文件 指针 ， 若 出 错 则 返回 NULL 
posix openpt (int oflag) ; 
<stdlib.h> p.545 


«fcntl.h» 
oflag: O RWDR, O NOCTTY 


BEHA: 车 成 功 则 返回 下 一 个 可 用 的 PTY 主 设备 的 文件 描述 符 ， 若 出 错 则 返回 ~1 
3243, FreeBSD 52.1 


pread(int filedes, void *buf, size_t nbytes, off_t offset) ; 
<unistd.h> p.59 


返回 值 : 读 到 的 字 节 数 ， 若 已 到 文件 结尾 则 返回 9， 若 出 错 则 返回 -~1 


printf(const char *restrict format, ...); 
«stdio.h» p.121 
返回 值 : 若 成 功 则 返回 输出 字符 数 ， 若 输出 出 错 则 返回 负 值 
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int pselect(int maxfdpl, fd set *restrict readfds, fd set *restrict writefds, 
fd set *restrict exceptfds, const struct timespec *restrict tsptr, 
const sigset t *restrict sigmask); 


«sys/select.h» p.384 
返回 值 ， 准 备 就 绪 的 描述 符 数 ， 若 超时 则 返回 9?， 若 出 错 则 返回 -~1 
平台 ; FreeBSD 5.2.1, Linux 2.4.22, Mac OS X 10.3 

void psignal(int signo, const char *msg) ; 


<signal.h> p.284 
<siginfo.h> /* on Solaris */ 


int pthread atfork(void (*prepare) (void), void (*parent) (void), 
void (*child) (void) ; 


«pthread .h> p.337 
返回 值 ， 若 成 功 则 返回 9?， 否 则 返回 错误 编号 


int pthread attr destroy(pthread attr t *attr); 
«pthread.h» p.314 
返回 值 ; 车 成 功 则 返回 9， 否则 返回 错误 编号 
int pthread attr getdetachstate(const pthread attr t *restrict attr, 
int *detachstate) ; 
«pthread.h» p.315 
返回 值 ， 若 成 功 则 返回 0， 否 则 返回 错误 编号 


int pthread attr getguardsize(const pthread attr t *restrict attr, 
size_t *restrict guardsize) ; 
«pthread.h» p.317 


返回 值 : 若 成 功 则 返回 90， 否则 返回 错误 编号 


int pthread attr getstack(const pthread attr t *restrict attr, void 
**restrict stackaddr, size t *restrict stacksize) ; 
«pthread.h» p.316 


返回 值 : 车 成 功 则 返回 0， 否 则 返回 错误 编号 
int pthread_attr_getstacksize(const pthread_attr_t *restrict attr, 
Size t *restrict slacksize) ; 


«pthread.h» p.317 
BA: 车 成 功 则 返回 0， 和 否则 返回 错误 编号 


int pthread attr_init (pthread attr t *attr); 
«pthread .h> p.314 


返回 值 : 车 成 功 则 返回 0， 否 则 返回 错误 编号 


int pthread attr setdetachstate(pthread attr t *atir, int detachstate) ; 
«pthread.h» p315 
返回 值 ， 车 成 功 则 返回 9， 否 则 返回 错误 编号 


int pthread attr setguardsize(pthread attr t *atir, size t guardsize) ; 
«pthread.h» p317 
返回 值 : 车 成 功 则 返回 0， 否 则 返回 错误 编号 
int pthread attr setstack(const pthread attr t *attr, void *stackaddr, 
Size t *stacksize) ; 
«pthread.h» p.316 
返回 值 : 车 成 功 则 返回 0， 否 则 返回 错误 编号 


int pthread attr setstacksize(pthread attr t ‘attr, size t stacksize) ; 
«pthread.h» p317 


BA: 车 成 功 则 返回 0， 否 则 返回 错误 编号 


bbs.theithome.com 





662 


int 


void 


void 


int 


int 


int 


int 


int 


int 


int 


int 


int 


int 


int 





附录 A 函数 原型 


pthread cancel(pthread t tid); 
«pthread.h» 


返回 值 : 车 成 功 则 返回 0， 和 否则 返回 错误 编号 


pthread cleanup pop(int execute); 
«pthread.h» 


pthread cleanup push(void (*rtn) (void *), void *arg); 
«pthread.h» 


Pthread condattr destroy(pthread condattr t *attr); 
«pthread.h» 
返回 值 ， 若 成 功 则 返回 9， 否则 返回 错误 编号 


pthread condattr_getpshared (const pthread_condattr_t *restrict attr, 
int *restrict pshared) ; 
<pthread.h> ` 
返回 值 : 车 成 功 则 返回 0， 否 则 返回 错误 编号 


pthread _condattr_init (pthread condattr t *atir); 


«pthread.h» 
返回 值 ， 若 成 功 则 返回 9?， 否 则 返回 错误 编号 


pthread condattr setpshared(pthread condattr t *attr, int pshared) ; 
«pthread.h» 
返回 值 : 车 成 功 则 返回 0， 否 则 返回 错误 编号 


pthread_cond broadcast (pthread_cond_t *cond); 


«pthread.h» 
BEE: 若 成 功 则 返回 0， 否 则 返回 错误 编号 


pthread_cond destroy (pthread_cond_t *cond); 


«pthread.h» 
BE: 若 成 功 则 返回 0， 和 否则 返回 错误 编号 


pthread cond init(pthread cond t *restrict cond, 
pthread condattr t *restrict attr); 
«pthread.h» 


返回 值 ， 若 成 功 则 返回 9， 否 则 返回 错误 编号 


pthread cond signal(pthread cond t *cond); 


«pthread.h» 
返回 值 : 车 成 功 则 返回 0， 否 则 返回 错误 编号 


pthread cond timedwait(pthread cond t *restrict cond, 
pthread mutex t *restrict mutex, 
const struct timespec *restrict timeout) ; 
«pthread.h» 


返回 值 : 若 成 功 则 返回 0， 否 则 返回 错误 编号 


pthread cond wait(pthread cond t *restrict cond, 
pthread mutex t *restrict mulex); 
«pthread.h» 
返回 值 ， 若 成 功 则 返回 9， 否 则 返回 错误 编号 


Pthread create (pthread t *restrict tidp, 
const pthread attr t *restrict attr, 
void *(*start rin) (void), void *restrict arg); 
«pthread.h» 
返回 值 : 车 成 功 则 返回 9， 否则 返回 错误 编号 
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int pthread detach (pthread t tid); 
<pthread.h> p.297 
返回 值 : 若 成 功 则 返回 0， 否 则 返回 错误 编号 


int pthread equal(pthread t tid], pthread_t tid2); 
«pthread.h» p.288 
WEA: 若 相等 则 返回 非 0 值 ， 否 则 返回 0 


void pthread_exit (void *rval_ptr) ; 

«pthread .h> p.291 
int pthread_getconcurrency (void) ; 

<pthread.h> p.317 


返回 值 : 当前 的 并 发 度 


void *pthread_getspecific (pthread key t key); 
'"epthread.h» p.330 
返回 值 : 线程 私有 数据 值 ， 若 设 有 值 与 键 关 联 则 返回 NULL 


int pthread join(pthread t thread, void **rval ptr) ; 
«pthread.h» p.291 
返回 值 ， 若 成 功 则 返回 9?， 否 则 返回 错误 编号 


int pthread_key create (pthread key t *keyp, void (*destructor) (void *); 
<pthread.h> p.328 
返回 值 : 车 成 功 则 返回 0， 和 否则 返回 错误 编号 


int pthread key delete (pthread key t *key); 


«pthread.h» p.329 
返回 值 : 若 成 功 则 返回 0， 否 则 返回 错误 编号 


int pthread kill(pthread t thread, int signo); 


<signal.h> p.334 
返回 值 : 若 成 功 则 返回 0， 否 则 返回 错误 编号 


int pthread_mutexattr_destroy (pthread mutexattr t *attr) ; 


<pthread.h> p.318 
返回 值 ， 若 成 功 则 返回 0， 和 否则 返回 错误 编号 


int pthread_mutexattr_getpshared(const pthread_mutexattr_t *restrict attr, 
int *restrict pshared) ; 
<pthread.h> p.318 
返回 值 : 车 成 功 则 返回 0， 否则 返回 错误 编号 


int pthread mutexattr gettype(const pthread mutexattr t *restrict attr, 
int *restrict type); 
«pthread.h-» p.319 
返回 值 : 车 成 功 则 返回 0， 和 否则 返回 错误 编号 


int pthread mutexattr init(pthread mutexattr t *atir) ; 


«pthread.h» p.318 
返回 值 : 车 成 功 则 返回 Oo， 否则 返回 错误 编号 


int pthread mutexattr setpshared(pthread mutexattr t ‘attr, int pshared) ; 
<pthread.h> p.318 


返回 值 : 若 成 功 则 返回 0， 否 则 返回 错误 编号 
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pthread mutexattr settype(pthread mutexattr t *atir, int type); 
«pthread.h» 
返回 值 ， 若 成 功 则 返回 9?， 否 则 返回 错误 编号 


Pthread mutex destroy (pthread mutex t *mutex) ; 
<pthread.h> 
返回 值 : 车 成 功 则 返回 9， 否 则 返回 错误 编号 


pthread_mutex_init (pthread_mutex_t *restrict mutex, 
const pthread_mutexattr_t *restrict attr) ; 
«pthread.h» 


BEE: 车 成 功 则 返回 0， 否 则 返回 错误 编号 


pthread mutex lock(pthread mutex t *mutex) ; 
«pthread.h» 
返回 值 : 若 成 功 则 返回 0， 否 则 返回 错误 编号 


pthread mutex trylock(pthread mutex t *mutex); 
«pthread.h» 


返回 值 ， 若 成 功 则 返回 9?， 否 则 返回 错误 编号 


pthread mutex unlock(pthread mutex t *mulex); 
«pthread.h» 
返回 值 ， 若 成 功 则 返回 9， 否 则 返回 错误 编号 


pthread_once(pthread_once_t *initflag, void (*initfn) (void); 
<pthread.h> 
pthread once t initflag = PTHREAD ONCE INIT; 


返回 值 : 车 成 功 则 返回 0， 和 否则 返回 错误 编号 


pthread rwlockattr destroy(pthread rwlockattr t *attr); 
«pthread.h» 
返回 值 : 车 成 功 则 返回 0， 否 则 返回 错误 编号 


pthread_rwlockattr_getpshared(const pthread_rwlockattr_t *restrict attr, 
int *restrict pshared) ; 
<pthread.h> 


返回 值 ， 若 成 功 则 返回 9， 否则 返回 错误 编号 


pthread rwlockattr init(pthread rwlockattr t *attr); 
«pthread.h» 
返回 值 : 车 成 功 则 返回 0， 否 则 返回 错误 编号 


pthread_rwlockattr_setpshared (pthread rwlockattr t *attr, int pshared); 
<pthread.h> 


返回 值 : 车 成 功 则 返回 0， 否 则 返回 错误 编号 
pthread rwlock destroy (pthread_rwlock_t *rwlock) ; 


<pthread.h> 
返回 值 : 车 成 功 则 返回 0， 否 则 返回 错误 编号 


- 


pthread rwlock init(pthread rwlock t *restrict rwlock, 
const pthread rwlockattr t *restrict attr) ; 
«pthread.h» 


返回 值 ， 若 成 功 则 返回 9?， 否 则 返回 错误 编号 


pthread rwlock rdlock (pthread rwlock t *rwlock) ; 
«pthread.h» 
返回 值 : 车 成 功 则 返回 0， 否 则 返回 错误 编号 
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int pthread rwlock tryrdlock(pthread rwlock t *rwlock) ; 
<pthread.h> p.306 
返回 值 ， 若 成 功 则 返回 9， 人 否则 返回 错误 编号 

int pthread rwlock trywrlock(pthread rwlock t *rwlock); 
«pthread.h» p.306 


返回 值 ， 若 成 功 则 返回 9?， 否 则 返回 错误 编号 


int pthread rwlock unlock(pthread rwlock t *rwlock) ; 
«pthread.h» p.306 
返回 值 ， 若 成 功 则 返回 9， 否则 返回 错误 编号 


int pthread rwlock wrlock(pthread rwlock t *rwlock) ; 
«pthread.h» p.306 


BEL: 若 成 功 则 返回 0， 否 则 返回 错误 编号 


pthread t pthread_self (void) ; 


«pthread .h> p.288 
返回 值 : 调用 线程 的 线程 ID 


int pthread_setcancelstate(int state, int *oldstate) ; 


«pthread.h» p.331 
返回 值 ， 若 成 功 则 返回 0， 否 则 返回 错误 编号 


int pthread setcanceltype(int type, int *oldtype) ; 
<pthread.h> p.332 
REHE: 若 成 功 则 返回 0， 否 则 返回 错误 编号 


int pthread_setconcurrency (int level) ; 
<pthread.h> p.317 
返回 值 ， 若 成 功 则 返回 9， 否则 返回 错误 编号 
int pthread setspecific(pthread key t key, const void *value); 
«pthread.h» p.330 
KE: 若 成 功 则 返回 0， 否 则 返回 错误 编号 
int pthread sigmask(int how, const sigset t *restrict set, 
sigset_t *restrict oset); 
<signal.h> p.334 
返回 值 : 若 成 功 则 返回 0， 否 则 返回 错误 编号 
void pthread _testcancel (void) ; 
<pthread.h> p.332 
char *ptaname (int fides); 
<stdlib.h> p.546 


返回 值 ， 若 成 功 则 返回 指向 PTY 从 设备 名 的 指针 ， 若 出 错 则 返回 NULL 
平台 : FreeBSD 5.2.1, Linux 2.4.22, Solaris 9 


int putc(int c, FILE *fp); 
«stdio.h» p.116 
返回 值 ， 若 成 功 则 返回 c， 若 出 错 则 返回 EOF 

int putchar(int c); £ 
<stdio.h> p.116 


返回 值 ， 若 成 功 则 返回 c， 若 出 错 则 返回 EOF 
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int putchar unlocked (int c); 
«stdio.h» p.326 
返回 值 ， 若 成 功 则 返回 c， 车 出 错 则 返回 EOF 


int puto unlocked(int c, FILE *fp); 
<stdio.h> p.326 
返回 值 : 若 成 功 则 返回 c， 若 出 错 则 返回 EOF 


int putenv (char *str) ; 
<stdlib.h> p.158 
返回 值 : 若 成 功 则 返回 0， 若 出 错 则 返回 非 0 值 


int putmag (int filedes, const struct strbuf *ctlptr, 
const struct strbuf *dalaptr, int flag); 


«stropts.h» p.372 
flag: 0, RS HIPRI 


BEA: 若 成 功 则 返回 0， 车 出 错 则 返回 1 
平台 : Linux 2.4.22，Solaris 9 


int putpmsg (int filedes, const struct strbuf *ctlptr, 
const struct strbuf *dataptr, int band, int flag); 


«stropts.h» , p.372 
flag: 0, MSG HIPRI, MSG BAND 


返回 值 : 若 成 功 则 返回 0， 车 出 错 则 返回 - 1 
平台 ; Linux 2.4.22, Solaris 9 


int puts (const char *str); 
<stdio.h> p.117 
BEA: 若 成 功 则 返回 非 负 值 ， 若 出 错 则 返回 EOF 


ssize t pwrite(int filedes, const void *buf, size t nbytes, off t offset); 
«unistd.h» p.59 
返回 值 : 若 成 功 则 返回 已 写 的 字 节 数 ， 若 出 错 则 返回 -1 


int raise(int signo); 
<signal .h> p.251 
返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 -1 


ssize t read(int filedes, void *buf, size t nbytes); 
<unistd.h> p.53 
返回 值 : 若 成 功 则 返回 读 到 的 字 节 数 ， 若 已 到 文件 结尾 则 返回 0， 若 出 错 则 返回 -1 


struct 
dirent ‘*readdir(DIR *dp); 
«dirent.h» p.98 
返回 值 ， 若 成 功 则 返回 指针 ， 若 在 目录 结尾 或 出 错 则 返回 NULL 
int readlink (const char *restrict pathname, char *restrict buf, 
size_t bufsize) ; 
<unistd.h> p.94 


返回 值 ， 若 成 功 则 返回 读 到 的 字 节 数 ， 若 出 错 则 返回 -1 


ssize t  readviint filedes, const struct iovec *iov, int iovent); 


«8ys/uio.h» p.387 
BEM: 若 成 功 则 返回 已 读 的 字 节 数 ， 若 出 错 则 返回 -1 

void *realloc(void *ptr, size t newsize) ; 
<stdlib.h> p.155 


返回 值 ， 若 成 功 则 返回 非 空 指 针 ， 若 出 错 则 返回 NULL 
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recv(int sockfd, void *buf, size_t nbytes, int flags); 
<sys/socket .h> p.454 
flags: 0, MSG PEEK, MSG OOB, MSG_WAITALL 
返回 值 ， 以 字 节 计数 的 消息 长 度 ， 若 无 可 用 消息 或 对 方 已 经 按 序 结 束 则 返回 9?， 若 出 
错 则 返回 -1 
平台 : MSG_TRUNC 标 志 在 Linux 2.4.22 上 支持 


recvfrom(int sockfd, void *restrict buf, size t len, int flags, 
struct sockaddr *restrict addr, socklen t *restrict addrlen); 
<sys/socket .h> p.455 
flags: 0, MSG_PEEK, MSG OOB, MSG WAITALL 
返回 值 ， 以 字 节 计数 的 消息 长 度 ， 若 无 可 用 消息 或 对 方 已 经 按 序 结 束 则 返回 8， 车 出 
错 则 返回 -1 
平台 : MSG_TRUNC 标 志 在 Linux 2.4.22 上 支持 


recvmsg(int sockfd, struct msghdr *msg, int flags); 
<sys/socket .h> p.455 
flags: 0, MSG_PEEK, MSG_OOB, MSG_WAITALL 


返回 值 ， 以 字 节 计数 的 消息 长 度 ， 若 无 可 用 消息 或 对 方 已 经 按 序 结 
束 则 返回 0， 若 出 错 则 返回 -1 
EE: MSG_TRUNC 标 志 在 Linux 2.4.22 上 支持 
remove(const char *pathname) ; 


<stdio.h> p.90 
返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 -1 


rename(const char *oldname, const char *newname) ; 
«stdio.h» p.91 


BEA: 若 成 功 则 返回 0， 若 出 错 则 返回 -1 
rewind (FILE *fp) ; f 
<stdio.h> p.120 


rewinddir(DIR *dp); 
«dirent.h» p.98 


rmdir(const char *pathname); 


<unistd.h> p.98 
BAA. 若 成 功 则 返回 0， 若 出 错 则 返回 -1 


scanf (const char *restrict format, ...); 
<stdio.h> p.124 


返回 值 ， 指 定 的 输入 项 数 ， 若 输入 出 错 或 在 任意 变换 前 已 到 达 文件 结尾 则 返回 EOF 


seekdir (DIR *dp, long loc); 
«dirent.h» p.98 


select (int maxfdpl, fd set *restrict readfds, fd set *restrict uritefds, 
fd set *restrict exceptfds, struct timeval *restrict tuptr); 


«sys/select.h» p.381 
返回 值 : 叭 备 就 绪 的 描述 符 数 ， 若 超时 则 返回 0， 若 出 错 则 返回 -1 

semctl(int semid, int semnum, int cmd, ... /* union semun arg */ ) 
<sys/sem.h> p.424 


cmd; IPC STAT, IPC SET, IPC RMID, GETPID, GETNCNT, 
GETZCNT, GETVAL, SETVAL, GETALL, SETALL 


返回 值 : (和 命令 相关 ) 
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semget(key t key, int msems, int flag); 
<sys/sem.h> p.423 
flag: 0, IPC_CREAT, IPC_EXCL 


BAÉ: 车 成 功 则 返回 信号 量 IDP， 若 出 错 则 返回 -1 


semop(int semid, struct sembuf semoparray[], size_t mops)’; 
<sys/sem.h> p.425 
返回 值 ， 若 成 功 则 返回 9?， 若 出 错 则 返回 ~1 


send(int sockfd, const void *buf, size t nbytes, int flags); 
<sys/socket .h» p.453 
flags: 0, MSG_DONTROUTE, MSG_EOR, MSG_OOB 
返回 值 : 若 成 功 则 返回 发 送 的 字 节 数 ， 若 出 错 则 返回 -1 
平台 : MSG_DONTWAIT 标 志 在 FreeBSD 5.2.1, Linux 2.4.22 和 Mac OS X 10.3 上 支持 ， 
MSG_EOR 标 志 在 Solaris 9 上 不 支持 


sendmsg(int sockfd, const struct msghdr *msg, int flags); 


<sys/socket .h> p.454 
flags: 0, MSG_DONTROUTE, MSG_EOR, MSG_OOB 


返回 值 : 若 成 功 则 返回 发 送 的 字 节 数 ， 若 出 错 则 返回 -1 
平台 : MSG_DONTWAIT 标 志 在 FreeBSD 5.2.1, Linux 2.4.22 和 Mac OS X 10.3 上 支持 ， 
MSG_EOR 标 志 在 Solaris 9 上 不 支持 


sendto(int sockfd, const void *buf, size t nbytes, int flags, 
const struct sockaddr *destaddr, socklen t destlen) ; 


«sys/socket.h» p.453 
flags: 0, MSG DONTROUTE, MSG EOR, MSG OOB 


返回 值 ， 若 成 功 则 返回 发 送 的 字 节 数 ， 若 出 错 则 返回 一 1 
平台 : MSG_DONTWAIT 标 志 在 FreeBSD 5.2.1, Linux 2.4.22 和 Mac OS X 10.3 上 支持 ， 
MSG_EOR 标 志 在 Solaris 9 上 不 支持 


setbuf (FILE *restrict fp, char *restrict buf); 
<stdio.h> p.111 


setegid(gid t gid); 
«unistd.h» p.195 
返回 值 : 车 成 功 则 返回 9， 若 出 错 则 返回 -1 


setenv(const char *name, const char *value, int rewrite); 


<stdlib.h> p-158 
返回 值 : 车 成 功 则 返回 9?， 若 出 错 则 返回 非 0 值 


seteuid(uid t uid); 


«unistd.h» p.195 
返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 -1 


setgid(gid t gid); 


«unistd.h» p.193 
返回 值 ; 若 成 功 则 返回 0， 若 出 错 则 返回 -1 

setgrent (void) ; 
«grp.h» p.137 


setgroups (int groups, const gid t grouplist[}) ; 
«grp.h» /* on Linux */ p.138 
«unistd.h» /* on FreeBSD, Mac OS X, and Solaris */ 


返回 值 : 若 成 功 则 返回 0， 车 出 错 则 返回 -1 


sethostent (int stayopen) ; 
«netdb.h» p.443 
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setjmp(jmp buf env); 
<setjmp.h> 


返回 值 ， 若 直 接 调用 则 返回 9,， 若 从 1ongjmp 调 用 返回 则 返回 非 0 值 


setlogmask (int maskpri) ; 


<syslog.h> 
返回 值 : 前 日 志 记录 优先 级 屏蔽 值 


setnetent (int stayopen) ; 
«netdb.h» 


setpgid(pid t pid, pid t pgid); 
<unistd.h> 


返回 值 : 若 成 功 则 返回 0， 若 出 错 则 返回 一 1 


setprotoent (int stayopen) ; 
«netdb.h» 


setpwent (void); 
«pwd.h» 


setregid(gid t rgid, gid t egid); 
«unistd.h» 


返回 值 ， 若 成 功 则 返回 9， 若 出 错 则 返回 -1 


setreuid(uid t ruid, uid t euid) ; 
«unistd.h» 


返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 一 ! 


setrlimit (int resource, const struct rlimit *rlpir); 
<sys/resource.h> 


返回 值 ， 若 成 功 则 返回 9?， 车 出 错 则 返回 非 0 值 


setservent (int stayopen) ; 
«netdb.h» 


getsid(void); 
«unistd.h» 


返回 值 : 车 成 功 则 返回 进程 组 DD， 若 出 错 则 返回 -1 


setsockopt (int sockfd, int level, int option, const void *vul, 
socklen_t len); 


<sys/socket .h> 


返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 一 ! 


setspent (void) ; 


<shadow.h> 
平台 : Linux 2.4.22, Solaris 9 


setuid(uid t uid); 
«unistd.h» 


BE: 车 成 功 则 返回 0， 若 出 错 则 返回 -1 


setvbuf (FILE *restrict fp, char *restrict buf, int mode, size t size); 
<stdio.h> 
mode: _IOFBF, _IOLBF, _IONBF 


AMA: 若 成 功 则 返回 0， 若 出 错 则 返回 非 0 值 
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*shmat (int shmid, const void *addr, int flag); 


<sys/shm.h> 
flag: 0, SHM RND, SHM RDONLY 


返回 值 : 若 成 功 则 返回 指向 共享 存储 的 指针 ， 若 出 错 则 返回 -1 


shmctl (int shmid, int cmd, struct shmid ds *buf); 


«8ys8/8hm.h» 
cmd: IPC STAT, IPC SET, IPC RMID, 
SHM LOCK, SHM UNLOCK 


返回 值 : 若 成 功 则 返回 0， 若 出 错 则 返回 -1 


shmdt (void *addr) ; 
<sys/shm.h> 
BEA: 若 成 功 则 返回 0， 若 出 错 则 返回 ~1 


shmget(key t key, int size, int flag); 
<sys/shm.h> 
flag: 0, IPC_CREAT, IPC_EXCL 


返回 值 ， 若 成 功 则 返回 共享 存储 ID， 若 出 错 则 返回 -1 


shutdown (int sockfd, int how); 
<sys/socket .h> 
how: SHUT RD, SHUT WR, SHUT RDWR 
BE: 车 成 功 则 返回 0， 若 出 错 则 返回 -1 


sig2str(int signo, char ‘*str) ; 
<signal .> 
返回 值 ， 若 成 功 则 返回 9?， 若 出 错 则 返回 -1 
平台 : Solaris 9 


sigaction (int signo, const struct sigaction *restrict act 
struct sigaction *restrict oact) ; 
<signal.h> 


返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 -1 


D 


Sigaddset(sigset t *sef, int signo) ; 
«signal.h» 


返回 值 : 若 成 功 则 返回 0， 若 出 错 则 返回 -1 


sigdelset (sigset_t *set, int signo) ; 
«Bignal.h» 
返回 值 ， 若 成 功 则 返回 9， 车 出 错 则 返回 1 


sigemptyset(sigset t *sel); 
«Bignal.h» 
返回 值 ， 若 成 功 则 返回 9， 车 出 错 则 返回 -1 


sigfillset (sigset t *set) ; 
<signal.h> 


返回 值 : 若 成 功 则 返回 0， 若 出 错 则 返回 -1 
sigismember (const sigset_t *set, int signo) ; 


<signal .h> 


返回 值 : 若 真 则 返回 1， 若 假 则 返回 0， 若 出 错 则 返回 -1 
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0 


void 


void 


int 


int 


int 


int 


int 


unsigned 


int 


int 


int 


int 


int 


int 


siglongjmp(sigjmp_buf env, int val); 


«set jmp.h» 
此 函数 不 返回 


(*signal (int signo, void (*func) (int))) (int); 


«gignal.h» 


返回 值 ， 若 成 功 则 返回 信号 以 前 的 处 理 配置 ， 若 出 错 则 返回 SIG_ERR 


sigpending (sigset t *set) ; 
<signal.h> 
返回 值 ， 若 成 功 则 返回 9， 车 出 错 则 返回 -1 


sigprocmask(int how, const sigset t *restrict set 
sigset t *restrict oset); 


«Signal.h» 
how: SIG BLOCK, SIG UNBLOCK, SIG SETMASK 


返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 -1 


sigsetjmp(sigjmp_buf env, int savemask) ; 
<setjmp.h> 


返回 值 : 若 直接 调用 则 返回 0， 若 从 siglcngjmp 调 用 返回 则 返回 非 0 值 


sigsuspend(const sigset t *sigmask) ; 
«gignal.h» 


返回 值 ，-1， 并 将 errno 设 置 为 EINTR 


sigwait(const sigset t *restrict set, int *restrict signop); 
«signal.h» 
返回 值 ， 若 成 功 则 返回 0， 否则 返回 错误 编号 


sleep (unsigned int seconds); 
<unistd.h> 


返回 值 : 0 或 未 休眠 够 的 秒 数 


snprintf(char *restrict buf, size t n, const char *restrict format, 


«gtdio.h» 


返回 值 : 车 成 功 则 返回 存 人 数组 的 字符 数 ， 若 编码 出 错 则 返回 负 值 


sockatmark (int sockfd) ; 
<sys/socket .h> 


返回 值 : 若 在 标记 处 则 返回 1， 若 没有 在 标记 处 则 返回 0， 若 出 错 则 返回 -1 


socket (int domain, int type, int protocol) ; 
<sys/socket .h> 
type: SOCK STREAM, SOCK DGRAM, SOCK_SEQPACKET, 


返回 值 : 车 成 功 则 返回 文件 〈 套 接 字 ) 描述 符 ， 若 出 错 则 返回 -1 


socketpair(int domain, int type, int protocol, int sockfd [21 ) ; 
<sys/socket .h> 
type: SOCK STREAM, SOCK DGRAM, SOCK_SEQPACKET, 
返回 值 : 若 成 功 则 返回 0， 若 出 错 则 返回 一 ! 


sprintf (char *restrict buf, const char *restrict format, ...); 
«stdio.h» 


返回 值 : 车 成 功 则 返回 存 人 数组 的 字符 数 ， 若 编码 出 错 则 返回 负 值 
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int sscanf (const char *restrict buf, const char *restrict format, vec) 
<stdio.h> p.124 
836 返回 值 : 指定 的 输入 项 数 ， 若 输入 出 错 或 在 任意 变换 前 已 到 达 文 件 结尾 则 返回 EOF 
int stat(const char *restrict pathname, struct stat *restrict buf); 
<sys/stat.h> p.71 


返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 ~1 


int str2sig(const char *sír, int *signop) ; 
«signal .h> p.285 


返回 值 : 若 成 功 则 返回 0， 若 出 错 则 返回 -1 
AEG. Solaris 9 


char *strerror(int errnum) ; 
<string.h> p.11 


返回 值 ， 指 向 消息 字符 捉 的 指针 


size_t strftime(char *restrict buf, size t maxsize, const char *restrict format, 
const struct tm *restrict tmptr) ; 


< 七 Ime . 卫 > p.144 
BE: 车 有 空间 则 返回 存 人 数组 的 字符 数 ， 否 则 返回 0 


char *strsignal(int signo); 
<string.h> p.284 
BEA: 指向 描述 该 信号 的 字符 串 的 指针 


int symlink(const char *actualpath, const char *sympath) ; 
<unistd.h> p.94 


返回 值 : 若 成 功 则 返回 0， 若 出 错 则 返回 -1 


void syne (void) ; 
<unistd.h> p.62 
long sysconf (int name); 
<unistd.h> p.33 
name: SC ARG MAX, SC ATEXIT MAX, SC CHILD MAX, 
.SC CLK TCK, SC COLL WEIGHTS MAX, 
.SC HOST NAME MAX, SC IOV MAX, SC JOB CONTROL, 
.SC LINE MAX, SC LOGIN NAME MAX, SC NGROUPS MAX, 
.SC OPEN MAX, SC PAGESIZE, SC PAGE SIZE, 
.SC READER WRITER LOCKS, SC RE DUP MAX, 
.SC SAVED 1DS, SC SHELL, SC STREAM MAX, 
.SC SYMLOOP MAX, SC TTY NAME MAX, SC TZNAME MAX, 
.SC VERSION, SC XOPEN CRYPT, SC XOPEN LEGACY, 
_SC_XOPEN_REALTIME, SC XOPEN REALTIME THREADS, 
.S8C XOPEN VERSION 
返回 值 : 若 成 功 则 返回 相应 值 ， 若 出 错 则 返回 ~1 
void syslog(int priority, char *format, ...); 
<syslog.h> p.346 
int system(const char *cmdstring) ; 
<stdlib.h> p.200 
837 返回 值 ，shell 的 终止 状态 
int tedrain(int filedes) ; 
<termios .h> p.524 


返回 值 ， 若 成 功 则 返回 9?， 若 出 错 则 返回 -1 
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teflow(int filedes, int action) ; 


«termios.h» 
action: TCOOFF, TCOON, TCIOFF, TCION 


返回 值 ， 若 成 功 则 返回 9， 车 出 错 则 返回 -1 


tcflush(int filedes, int queue); 
«termios.h» 
queue; TCIFLUSH, TCOFLUSH, TCIOFLUSH 


返回 值 ， 若 成 功 则 返回 0， 若 出 错 则 返回 -1 


tcgetattr(int filedes, struct termios *termptr) ; 


«termios.h» 


返回 值 ， 若 成 功 则 返回 9， 若 出 错 则 返回 -1 


tegetpgrp (int filedes) ; 
<unistd.h> 


BAR: 若 成 功 则 返回 前 台 进 程 组 的 进程 组 ID， 若 出 错 则 返回 -1 


tegetsid(int filedes) ; 
«termios.h» 


返回 值 : 车 成 功 则 返回 会 话 首 进程 的 进程 组 ID ， 若 出 错 则 返回 -1 


tcsendbreak(int filedes, int duration) ; 
«termios.h» 


返回 值 ， 若 成 功 则 返回 9， 若 出 错 则 返回 一 1 


tcsetattr(int filedes, int opt, const struct termios *fermptr) ; 
«termios.h» 
opt: TCSANOW, TCSADRAIN, TCSAFLUSH 


返回 值 ， 若 成 功 则 返回 9， 若 出 错 则 返回 一 1 


tesetpgrp (int filedes, pid t pgrpid); 
<unistd.h> 


返回 值 ， 若 成 功 则 返回 9， 若 出 错 则 返回 -1 


telldir(DIR *dp) ; 
<dirent .h> 


返回 值 ， 与 dp 关联 的 目录 中 的 当前 位 置 


*tempnam(const char ‘directory, const char *prefix) ; 
<stdio.h> 


返回 值 ， 指 向 唯一 路 径 名 的 指针 


time(time t *calptr) ; 
«time.h» 


返回 值 ， 若 成 功 则 返回 时 间 值 ， 若 出 错 则 返回 -1 


times(struct tms *buf); 
<sys/times.h> 
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p.524 


p.524 


p.516 


p.221 


p222 


p.524 


p.516 


p.221 


p.98 


p.128 


p.142 


p.208 


EE: 若 成 功 则 返回 流逝 的 墙 上 时 钟 时 间 (单位 ;时 钟 滴答 数 ) ， 若 出 错 则 返回 -1 


*tmpfile(void); 
«stdio.h» 


返回 值 : 若 成 功 则 返回 文件 指针 ， 若 出 错 则 返回 NULL 


*tmpnam(char *pir) ; 
<stdio.h> 


返回 值 ， 指 向 唯一 路 径 名 的 指针 
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int truncate(const char ‘pathname, off t length); 
<unistd.h> 


BA: 车 成 功 则 返回 0， 若 出 错 则 返回 ~1 


char *ttyname (int filedes) ; 
<unistd.h> 


返回 值 ， 指 向 终端 路 径 名 的 指针 ， 若 出 错 则 返回 NULL 


mode_t umask (mode_t cmask) ; 
<sys/stat.h> 


返回 值 ， 以 前 的 文件 模式 创建 屏蔽 字 


int uname (struct utsname *name) ; 
«Bys/utsname.h» 


返回 值 ， 若 成 功 则 返回 非 负 值 ， 若 出 错 则 返回 -1 


int ungetc(int c, FILE *fp); 
<stdio.h> 
A: 若 成 功 则 返回 c， 若 出 错 则 返回 BOF 


int unlink(const char *pathname) ; 
<unistd.h> 


返回 值 : 若 成 功 则 返回 0， 若 出 错 则 返回 -1 


int unlockpt (int filedes) ; 
<stdlib.h> 


BEHE: 若 成 功 则 返回 0， 若 出 错 则 返回 -1 
324; FreeBSD 5.2.1, Linux 2.4.22, Solaris 9 


void unaetenv (const char *name) ; 
<stdlib.h> 
int utime(const char ‘pathname, const struct utimbuf *fimes); 


<utime.h> 


返回 值 : 车 成 功 则 返回 0， 若 出 错 则 返回 -1 


int vfprint£ (FILE *restrict fp, const char *restrict format, va_list arg); 
<stdarg.h> 
<stdio.h> 


返回 值 : 车 成 功 则 返回 和 输出 字符 数 ， 若 输出 出 错 则 返回 负 值 


int vfscanf(FILE *restrict fp, const char *restrict format, va_list arg); 


<stdarg.h> 
<stdio.h> 
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p.86 


p.525 


p.141 


p.115 


p.89 


p.545 


p.158 


p.96 


p.123 


p.125 


返回 值 : 指定 的 输入 项 数 ， 若 输入 出 错 或 在 任 一 变换 前 已 到 达 文 件 结尾 则 返回 EOF 


int vprintf(const char *restrict format, va_list arg); 


<stdarg.h> 
<stdio.h> 


返回 值 : 若 成 功 则 返回 输出 字符 数 ， 若 输出 出 错 则 返回 负 值 


int vacanf (const char *restrict format, va_list arg); 
<stdarg.h> 
<stdio.h> 


p.123 


p.125 


返回 值 ， 指定 的 输入 项 数 ， 若 输入 出 错 或 在 任 一 变换 前 已 到 达 文 件 结尾 则 返回 EOF 
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0 


int 


int 


int 


void 


pid t 


int 


pid t 


pid t 


pid t 


seize t 


ssize t 


vsnprintf(char *restrict buf, size t m, const char *restrict format, 
va list arg); 
«stdarg.h» p.123 
<stdio.h> 


EA: 若 成 功 则 返回 存 入 数组 的 字符 数 ， 若 编码 出 错 则 返回 负 值 


vaprinté (char *restrict buf, const char *restrict format, va_list arg); 


<stdarg.h> p.123 
<stdio.h> 


返回 值 ， 若 成 功 则 返回 存 人 数组 的 字符 数 ， 若 编码 出 错 则 返回 负 值 


vsscanf (const char *restrict buf, const char *restrict format, 


va list arg) $ 
«stdarg.h» p.125 
«gtdio.h» 


返回 值 :指定 的 输入 项 数 ， 若 输入 出 错 或 在 任 一 变换 前 已 到 达 文 件 结尾 则 返回 BOF 


vsyslog(int priority, const char *format, va_list arg); 
<syslog.h> p.348 
<stdarg.h> 

wait (int *statloc) ; 
<sys/wait.h> p.179 
BEA: 若 成 功 则 返回 进程 ID，0， 若 出 错 则 返回 一 ! 


waitid(idtype t idtype, id t id, siginfo t *infop, int options); 
<sys/wait .h> p.184 
idtype: P_PID, P_PGID, P_ALL 
options : WCONTINUED, WEXITED, WNOHANG, WNOWAIT, WSTOPPED 
返回 值 : 若 成 功 则 返回 0， 若 出 错 则 返回 -1 
平台 ; Solaris 9 


waitpid(pid_t pid, int *statloc, int options) ; 
«8y8/walt.h» p.179 
options: 0, WCONTINUED, WNOHANG, WUNTRACED 
返回 值 :车 成 功 则 返回 进程 ID，0， 若 出 错 则 返回 ~1 


wait3(int *statloc, int options, struct rusage *rusage) ; 


<sys/types.h> p.184 
<sys/wait .h> 

<sys/time.h> 

<sye/resource.h> 

options. 0, WNOHANG, WUNTRACED 


返回 值 ， 若 成 功 则 返回 进程 ，0， 若 出 错 则 返回 -1 


wait4(pid_t pid, int *statloc, int options, struct rusage *rusage) ; 


<sys/types.h> p.184 
<sys/wait .h> 

<sys/time.h> 

<sys/resource .h> 

options: 0, WNOHANG, WUNTRACED 


返回 值 : 若 成 功 则 返回 进程 ID ，0， 若 出 错 则 返回 -1 


write(int filedes, const void *buf, size t nbytes) ; 
«unistd.h» p.54 
返回 值 ， 若 成 功 则 返回 已 写 的 字 节 数 ， 若 出 错 则 返回 -1 

writev(int filedes, const struct iovec *iov, int iovcnt); 


<sys/uio.h> p.387 
返回 值 : 车 成 功 则 返回 已 写 的 字 节 数 ， 若 出 错 则 返回 -1 
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其 他 源 代 码 


B.1 本 书 使 用 的 头 文件 


正文 中 的 大 多 数 程序 都 包含 头 文件 apue .h， 见 程序 清单 B-1。 其 中 定义 了 常量 (An 
MAXLINE) 和 我 们 自 编 的 函数 的 原型 。 

ARS RPE LS POISE: <stdio.h>, <stdlib.h> (其 中 有 exit 函 数 原 
型 ) 和 <unista.hn> (其 中 包含 所 有 标准 UNIX 函 数 原型 )， 所 以 apue .h 自 动 包 含 了 这 些 系统 
头 文件 ， 同 时 还 包含 了 <string.h>。 这 样 就 减少 了 本 书 正文 中 列 出 的 所 有 程序 的 长 度 。 


程序 清单 B-1 头 文件 apue.h 


/* Our own header, to be included before all standard system headers */ 


#ifndef  APUE H 
#define  APUE H 


#define XOPEN SOURCE 600 /* Single UNIX Specification, Version 3 */ 


finclude <sys/types.h> /* some systems still require this */ 
#include «sys/stat.h» 
#include «sys/termios.h» /* for winsize */ 


#ifndef TIOCGWINSZ 
#include «sys/ioctl.h» 


#endif 
#include <stdio.h> /* for convenience */ 
#include <stdlib.h> /* for convenience */ 
#include <stddef .h> /* for offsetof */ 
#include <string.h> /* for convenience */ 
#include <unistd.h> /* for convenience */ 
#include <signal .h> /* for SIG_ERR */ 
#define MAXLINE 4096 /* max line length */ 
/* 
* Default file access permissions for new files. 
*/ 
define FILE MODE (S IRUSR | S IWUSR | S IRGRP | S IROTH) 
/* 
* Default permissions for new directories. 
*/ 
itdefine DIR MODE (FILE MODE | S IXUSR | S IXGRP | S IXOTH) 
typedef void Sigfunc (int); /* for signal handlers */ 


Sif defined(SIG IGN) && !defined(SIG ERR) 
#define SIG ERR ((Sigfunc *)-1) 
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#fendif 


#define 
#define 


/* 


min (a,b) ((a) < (b) ? (a) : (b)) 
max (a,b) ((a) » (b) ? (a) : (b)) 


* Prototypes for our own functions. 


x/ 
char 
long 
void 
void 
void 
void 
Sigfunc 
int 
int 
int 
void 
#ifdef 


#endif 
void 
ssize_t 
ssize_t 
void 
int 

int 

int 

int 

int 

int 

int 

int 


int 
int 
#ifdef 
pid_t 
#endif 


int 
#define 


#define 
ftdefine 
#define 
#define 


pid_t 
#define 


*path_alloc(int *); 

open_max (void) ; 

clr fl(int, int); 
set_fl(int, int); 

pr_exit (int) ; 

pr mask(const char *); 
*signal intr(int, Sigfunc *); 


tty cbreak(int); 
tty raw(int); 

tty reset (int); 
tty atexit (void); 


ECHO /* only if «termios.h» has been included */ 
struct termios *tty_termios (void); 


sleep_us(unsigned int); 

readn(int, void *, size t); 
writen(int, const void *, size t); 
daemonize(const char *); 


8 pipe(int *); 
recv fd(int, ssize t (*func) (int, 
const void *, size t)); 
send fd(int, int); 
send err(int, int, 
const char *); 
serv listen(const char *); 
serv_accept (int, uid t *); 
cli_conn(const char *); 
buf_args(char *, int (*func) (int, 
char **)); 


ptym open(char *, int); 
ptys open(char *); 
TIOCGWINSZ 


pty fork(int *, char *, int, const struct termios *, 


const struct winsize *); 


lock reg(int, int, int, off t, int, off t); 


read lock(fd, offset, whence, len) \ 
lock reg((fd), F SETLK, F RDLCK, 


readw lock(fd, offset, whence, len) \ 


lock reg((fd), F SETLKW, F RDLCK, 


write lock(fd, offset, whence, len) \ 


lock reg((fd), F SETLK, F WRLCK, 
writew lock(fd, offset, whence, len) 

lock reg((fd), F SETLKW, F WRLCK, 
un lock(fd, offset, whence, len) \ 

lock reg((fd), F SETLK, F UNLCK, 


(offset), 
(offset), 

(offset), 

\ 
(offset), 


(offset), 


lock test(int, int, off t, int, off t); 


is read lockable(fd, offset, whence, 


len) \ 
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(lock test((fd), F RDLCK, (offset), (whence), (len)) == 0) 
#define is write lockable(fd, offset, whence, len) V 
(lock test((fd), F WRLCK, (offset), (whence), (len)) == 0) 
void err dump(const char *, ...); 
void err msg(const char *, ...); 
void err quit(const char *, ...); 
void err exit(int, const char *, ...); 
void err ret(const char *, ...); 
void err sys(const char *, ...); 
void log msgí(const char *, ...); 
void log open(const char *, int, int); 
void log quití(const char *, ...); 
void log_ret (const char *, ...); 
void log sys(const char *, ...); 


void TELL WAIT (void); 
void TELL PARENT (pid t); 
void TELL CHILD(pid t); 


void WAIT PARENT (void); 
void WAIT CHILD(void); 


Wendif  /*  APUE H */ 


程序 中 先 包括 apue .hn， 然 后 再 包括 一 般 的 系统 头 文件 ， 这 样 做 的 原因 是 使 我 们 可 以 先 定 


义 一 些 在 此 后 包括 的 头 文件 可 能 要 求 的 内 容 ， 控 制 头 文件 被 包括 的 顺序 ， 以 及 使 我 们 可 以 重 定 
义 某 些 部 分 ， 而 这 正 是 为 隐藏 系统 之 间 的 差别 而 需要 解决 的 。 


B.2 标准 出 错 处 理 例 程 


我 们 提供 了 两 套 出 错 处 理 函 数 ， 它 们 用 于 本 书 中 大 多 数 实例 以 处 理 各 种 出 错 情 况 。 一 套 以 
err_ 开 头 ， 向 标准 出 错 文件 输出 一 条 出 错 消 息 ， 另 一 套 以 log_ 开 头 ， 用 于 多 半 没 有 控制 终端 
的 守护 进程 (4,55 133€), 

提供 了 这 些 出 错 处 理 函 数 后 ， 只 要 在 程序 中 写 一 行 C 代 码 就 可 以 进行 出 错 处 理 ， 例 如 : 

if (出 错 条 件 ) 

err dump ( 带 任意 参数 的 printf 格 式 ); 
这 样 也 就 不 再 需要 使 用 下 列 代 码 : 
if (HERR) ( 
char buf[200]; 


sprintf(buf， 带 任意 参数 的 printf 格 式 ) ; 
perror(buf); 
abort( ); 


} 


我 们 的 出 错 处 理 函 数 使 用 了 ISO C 的 变 长 参数 表 设 施 。 其 详细 说 明 见 Kernighan 和 Ritchie[1998] 
的 7.3 节 。 应 当 注 意 的 是 这 一 ISO C 设施 与 早期 系统 (例如 SVR3 和 4.3BSD) 提供 的 varargs 设 
施 不 同 。 虽 然 宏 的 名 字 相同 ， 但 宏 的 某 些 参数 已 经 发 生 了 改变 。 

表 B-1 列 出 了 各 个 出 错 处 理 函 数 之 间 的 区 别 。 

程序 清单 B-2 给 出 了 输出 至 标准 出 错 文件 的 出 错 处 理 函 数 。 
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表 B-1 标准 出 错 处 理 函 数 
从 strerzroz 增 加 字符 昌 ? 































err_dump 是 abort (); 
err_exit 是 exit(1); 
err msg 否 return; 
err quit 否 exit(1); 
err ret 是 return; 
err_sys 是 exit(1); 
log. msg d return; 
log guit 否 exit(2); 
log ret 是 errno return; 
log_sys 是 errno exit(2); 


程序 清单 B-2 ”输出 至 标准 出 错 文件 的 出 错 处 理 函 数 


#include "apue ,hn 
#include <errno.h> /* for definition of errno */ 
#include <stdarg.h> /* ISO C variable aruments */ 


static void err doit(int, int, const char *, va list); 


/* 
* Nonfatal error related to a system call. 
* Print a message and return. 
*/ 

void 

err_ret (const char *fmt, ...) 


{ 


va_list ap; 


va_start(ap, fmt); 
err_doit(1, errno, fmt, ap); 
va_end (ap); 


} 
/* 


* Fatal error related to a system call. 
* Print a message and terminate. 
*/ 

void 

err sys(const char *fmt, ...) 

{ 


va_list ap; 


va_start (ap, fmt); 

err doit(1, errno, fmt, ap); 
va end(ap); 

exit (1); 


* Fatal error unrelated to a system call. 
* Error code passed as explict parameter. 
* Print a message and terminate. 
*/ 

void 

err exit(int error, const char *fmt, ...) 


{ 
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va_list ap; 


va_start (ap, fmt); 

err doit(1, error, fmt, ap); 
va_end (ap) ; 

exit (1); 


} 
/* 


* Fatal error related to a system call. 
* Print a message, dump core, and terminate. 
*/ 

void 

err dump(const char *fmt, ...) 


va list ap; 


va start(ap, fmt); 
err doit(1, errno, fmt, ap); 


va_end (ap) ; 
abort () ; /* dump core and terminate */ 
exit (1); /* shouldn’t get here */ 


} 
/* 


* Nonfatal error unrelated to a system call. 
* Print a message and return. 


*/ 
void 
err msg(const char *fmt, ...) 
{ 
va_list ap; 


va_start(ap, fmt); 
err doit(0, 0, fmt, ap); 
va end(ap); 


) 
/* 


* Fatal error unrelated to a system call. 
* Print a message and terminate. 
*/ 

void 

err quit(const char *fmt, ...) 


va list ap; 


va Start(ap, fmt); 

err doit(0, 0, fmt, ap); 
va end(ap) ; 

exit(1); 


} 

/* 

* Print a message and return to caller. 
* Caller specifies "errnoflag". 

*/ 


Static void 


{ 


char buf [MAXLINE] ; 
vsnprintf (buf, MAXLINE, fmt, ap); 
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err_doit(int errnoflag, int error, const char *fmt, va_list ap) 
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if (errnoflag) 
snprintf (buf+strlen (buf), MAXLINE-strlen(buf), ": ts", 
strerror (error) ) ; 
strcat (buf, "\n"); 


fflush (stdout); /* in case stdout and stderr are the same */ 
fputs (buf, stderr) ; 
fflush (NULL) ; /* flushes all stdio output streams */ 





程序 清单 B-3 给 出 了 各 log_xxx 出 错 处 理 函 数 。 若 进程 不 以 守护 进程 方式 运行 ， 那 么 这 些 
函数 要 求 调用 者 定义 变量 1o0g_to_staerr， 并 将 其 设置 为 非 0 值 。 在 这 种 情况 下 ， 出 错 消 息 
被 送 至 标准 出 错 文件 。 若 1og_to_staerzr 标 志 为 0， 则 使 用 sys1log 设 施 ( 见 13.4 节 )。 


程序 清单 B-3 用 于 守护 进程 的 出 错 处 理 函 数 





/* 

* Error routines for programs that can run as a daemon. 
*/ 
#include "apue.h" 
#include «errno.h» /* for definition of errno */ 
#include «stdarg.h» /* ISO C variable arguments */ 


#include «syslog.h» 
static void log doit(int, int, const char *, va_list ap); 


/* 

* Caller must define and set this: nonzero if 
* interactive, zero if daemon 

*/ 


extern int (log to stderr; 


/* 
* Initialize syslog(), if running as daemon. 
*/ 
void 
log opení(const char *ident, int option, int facility) 


if (1og to stderr == 0) 
openlog (ident, option, facility); 


} 
/* 


* Nonfatal error related to a system call. 
* Print a message with the system's errno value and return. 
*/ 
void 
log_ret (const char *fmt, ...) 
{ 
va_list ap; 
va_start(ap, fmt); 
log_doit(1, LOG_ERR, fmt, ap); 
va_end (ap) ; 


} 
/* 


* Fatal error related to a system call. 
* Print a message and terminate. 
*/ 

void 

log_sys(const char *fmt, ...) 
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{ 
va_list ap; 
va start(ap,, fmt); 
log doit (1, LOG ERR, fmt, ap); 
va end(ap); 
exit (2); 
} 
/* 


* Nonfatal error unrelated to a system call. 
* Print a message and return. 
*/ 

void 

log msg(const char *fmt, ...) 


va list ap; 


va start(ap, fmt); 
log doit (0, LOG ERR, fmt, ap); 
va_end (ap) ; 
) 
/* 
* Fatal error unrelated to a system call. 
* Print a message and terminate. 


*/ 

void 

log quit(const char *fmt, ...) 

{ 
va_list ap; 
va_start(ap, fmt); 
log doit(0, LOG_ERR, fmt, ap); 
va_end (ap); 
exit (2); 

} 

/* 


* Print a message and return to caller. 
* Caller specifies "errnoflag" and "priority". 
*/ 


Static void 


log doit(int errnoflag, int priority, const char *fmt, va list ap) 


int errno save; 
char buf [MAXLINE]; 


errno save - errno; /* value caller might want printed */ 


vsnprintf (buf, MAXLINE, fmt, ap); 
if (errnoflag) 
snprintf (buf«strlen(buf), MAXLINE-strlen(buf), ": %s", 
strerror (errno save)); 
strcat (buf, "\n"); 
if (log to stderr) { 
fflush (stdout) ; 
fputs (buf, stderr); 
fflush(stderr); 
} else ( 
syslog(priority, buf); 
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附录 C 
部 分 习题 答案 


第 1 章 


1.1 


1.2 


1.6 


这 个 习题 利用 1s(]) 命 令 的 下 面 两 个 参数 : -i， 显 示 文 件 或 目录 的 i 节 点 号 〈4.14 节 中 详细 
HEIA) ，-d， 显 示 目 录 的 信息 ， 而 不 是 目录 中 所 有 文件 的 信息 。 
执行 下 列 命令 : 


$ ls -ldi /etc/. /etc/.. ~ 要求 打印 节点 号 
162561 drwxr-xr-x 66 root 4096 Feb 5 03:59 /etc/./ 
2 drwxr-xr-x 19 root 4096 Jan 15 07:25 /etc/../ 
$ 18 -1di /. /.. .和 ,. 的 i 节 点 号 均 为 2 
2 drwxr-xr-x 19 root 4096 Jan 15 07:25 /./ 
2 drwxr-xr-x 19 root 4096 Jan 15 07:25 /../ 


UNIX 系 统 是 多 道 程序 或 多 任务 系统 ， 所 以 ， 在 程序 清单 1-4 中 的 程序 运行 的 同时 其 他 两 个 
进程 也 在 运行 。 

若 perzor 的 ptr 参 数 是 一 个 指针 ， 则 perror 可 以 改变 ptr 所 指 字符 串 。 利 用 限定 符 const 
使 得 Perror 不 能 修改 ptr 所 指 的 字符 串 。 而 strerzozr 的 参数 是 错误 号 ， 它 是 整 型 的 并 且 
C 按 值 传递 所 有 参数 ， 因 此 strerror 国 数 即使 想 也 不 能 修改 这 个 值 。( 如 果 对 C 中 国 数 参 
数 的 处 理 不 是 很 清楚 ， 可 参见 Kernighan 和 Ritchie[1988] 的 5.2 节 ,) 

调用 fflush、fprintf 和 vprintf 隙 数 可 修改 errno 的 值 。 如 果 这 些 函 数 修改 了 errno 
的 值 但 我 们 没有 保存 ， 则 最 终 显示 的 出 错 消息 是 不 正确 的 。 

在 2038 年 。 将 time_t 数 据 类 型 定 为 64 位 整 型 ， 就 可 以 解决 该 问题 了 。 如 果 它 现在 是 32 位 
整 型 ， 那 么 为 使 应 用 程序 正常 工作 应 当 对 其 进行 重新 编译 。 但 是 这 一 问题 还 有 更 糟糕 之 处 。 
某 些 文件 系统 及 备份 介质 以 32 位 整 型 存储 时 间 。 对 于 这 些 同 样 需要 加 以 更 新 ， 但 又 需 能 读 
旧 的 格式 。 

大 约 248 天 。 


第 2 章 


2.1 


下 面 是 FreeBSD 中 使 用 的 技术 。 在 头 文件 <machine/_types .n> 中 定义 可 在 多 个 头 文件 
中 出 现 的 基本 数据 类 型 。 例 如 : 


#ifndef MACHINE TYPES H_ 
#define MACHINE TYPES H 


typedef int . int32 t; 
typedef unsigned int . uint32 t; 
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typedef _ uint32 t . size t; 


&endif /* MACHINE TYPES H */ 


在 每 个 可 以 定义 基本 系统 数据 类 型 size_t 的 头 文件 中 ， 我 们 可 以 有 序列 。 


#ifndef — SIZE T DECLARED 


typedef _ size_t size_t; 
#define _SIZE_T_DECLARED 
#endif 


这 样 ， 实 际 上 只 执行 一 次 size_t 的 typedef。 

23 如 果 OPEN_MAX 是 未 确定 的 或 大 得 出 奇 ( 即 等 于 LONG_MAX)， 那 么 我 们 可 以 使 用 
getrlimit 以 得 到 每 个 进程 的 最 大 打开 文件 描述 符 数 。 因 为 可 以 修改 对 每 个 进程 的 限 
制 ， 所 以 我 们 不 能 将 从 前 一 个 调用 得 到 的 值 高 速 缓存 起 来 ( 它 可 能 已 被 更 改 )， 见 程序 清 
单 C-1。 


程序 清单 C-1 标识 最 大 可 能 文件 描述 符 的 替换 方法 


#include "apue.h" 
#include «limits.h» 
#include <sys/resource.h> 


#define OPEN_MAX GUESS 256 


long 
open_max (void) 


long openmax; 
struct rlimit r1; 


if ((openmax = sysconf( SC OPEN MAX)) < 0 || 
openmax == LONG MAX) { 

if (getrlimit (RLIMIT NOFILE, &rl) < 0) 
err sys("can't get file limit"); 

if (rl.rlim max == RLIM INFINITY) 
openmax = OPEN MAX GUESS; 

else 
openmax - rl.rlim max; 


) 


return (openmax) ; 


第 3 章 


3.4 所 有 的 磁盘 IO 都 要 经 过 内 核 的 块 缓冲 区 〈 也 称 为 内 核 的 缓冲 区 高 速 缓存 ) ， 唯 一 例外 的 是 
对 原始 磁盘 设备 的 HO ， 但 是 我 们 不 考虑 这 种 情况 。Bach[1986] 的 第 3 章 描述 了 这 种 缓冲 区 
高 速 缓存 的 操作 ) 。 既 然 read 或 write 的 数据 都 要 被 内 核 缓冲 ， 那 么 术语 “不 带 缓冲 的 IO” 
指 的 是 在 用 户 的 进程 中 对 这 两 个 国 数 不 会 自动 缓冲 ， 每 次 read 或 write 就 要 进行 一 次 系 
统 调用 。 

33 每 次 调用 open 国 数 就 分 配 一 个 新 的 文件 表 项 ， 但 是 因为 两 次 打开 的 是 相同 的 文件 ， 所 以 
两 个 文件 表 项 指向 相同 的 v 节 点 。 调 用 aup 引 用 已 存在 的 文件 表 项 (此 处 指 Ea1 的 文件 表 项 )， 
见 图 C-1。 当 F_SETPFD 作 用 于 fdal1 时 ， 只 影响 fd1 的 文件 描述 符 标志 ，F_SETFIL 作 用 于 
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fdi 时 ， 则 影响 fda1 及 fd2 指 向 的 文件 表 项 。 
进程 表 项 





文件 表 
文件 状态 标志 
当前 文件 偏 移 量 
Vv 节点 指针 

















文件 状态 标志 当前 文件 长 度 
当前 文件 偏 移 量 
Y 节 点 指针 一 | 


图 C-1 open 和 dup 的 结果 


3.4 如 果 fd 是 1， 执行 hup2 (fq,1) 后 返回 1， 但 是 没有 关闭 描述 符 1 ( 见 3.12 节 讨论 )。 调 用 3 
次 daup2 后 ，3 个 描述 符 指向 相同 的 文件 表 项 ， 所 以 不 需要 关闭 描述 符 。 
但 如 果 fd 是 3， 调 用 3 次 dup2 后 ， 有 4 个 描述 符 指向 相同 的 文件 表 项 ， 这 种 情况 下 就 需 
要 关闭 描述 符 3。 
3.5 因为 shell 从 左 到 右 处 理 命令 行 ,所 以 
./a.out > outfile 2>&1 
首先 设置 标准 输出 到 outfile， 然 后 执行 dup 将 标准 输出 复制 到 描述 符 2 (标准 错误 ) E, 
其 结果 是 将 标准 输出 和 标准 错误 设置 为 同一 文件 ， 即 描述 符 1 和 描述 符 2 指 向 同一 个 文件 表 
项 。 而 对 于 命令 行 
./a.out 2>&1 > outfile 
由 于 首先 执行 4up， 所 以 使 描述 符 2 成 为 终端 (假设 命令 是 交互 运行 的 )， 标 准 输出 重 定向 
到 outfile。 结 果 是 描述 符 1 指 向 outfile 的 文件 表 项 ， 描 述 符 2 指向 终端 的 文件 表 项 。 
3.6 这 种 情况 之 下 ， 仍 然 可 以 用 1seek 和 read 国 数 读 文 件 中 任意 一 处 的 内 容 。 但 是 write 国 
数 在 写 数据 之 前 会 自动 将 文件 偏 移 量 设置 为 文件 尾 ， 所 以 写 文件 时 只 能 从 文件 尾 开始 。 


第 4 章 


4.1 才 调 用 stat 函 数 ， 它 总 是 顺 着 符号 链接 向 前 ( 表 4-9) ， 所 以 该 程序 决 不 会 显示 文件 类 型 是 
“符号 链接 ”。 例 如 ， 正 如 本 书 文 中 所 示 /dev/cdrom 是 cdroms /cdrom0 的 一 个 符号 链接 
( 它 本 身 也 是 到 . ./scsi/host0/bus0/target0/1lun0/cd 的 符号 链接 )， 但 是 stat 函 
数 的 结果 只 显示 /dev/cdrom 是 一 个 块 特殊 文件 ， 而 不 说 明 它 是 一 个 符号 链接 。 若 符号 链 
接 指向 一 个 不 存在 的 文件 ， 则 stat 返 回 出 错 。 

42 关闭 了 该 文件 的 所 有 访问 权限 ， 


$ umask 777 

$ date > temp. foo 

$ ls -1 temp. foo 

---------- 1 sar 0 Feb 5 14:06 temp.foo 


43 下 面 的 命令 表示 关闭 用 户 读 权 限时 所 发 生 的 情况 ， 
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$ date > foo 


$ chmod u-r foo 关闭 用 户 读 权限 
$ la -1 foo 验证 文件 的 权限 
--wW-r--r-- 1 sar 29 Feb 5 14:21 foo 
$ cat foo 读 文 件 


cat: foo: Permission denied 


44 如 果 用 open 或 creat 创 建 已 经 存在 的 文件 ， 则 该 文件 的 访问 权限 位 不 变 。 运 行程 序 清单 


4.5 


4.7 


4.8 


4.9 


4.10 


4.12 


4-3 中 的 程序 可 以 验证 这 点 。 
$ rm foo bar 删除 文件 
$ date > foo 创建 文件 
$ date > bar 
$ chmod a-r foo bar 关闭 所 有 的 读 权限 
$ ls -1 foo bar 验证 其 权限 
--W------- 1 sar 29 Feb 5 14:25 bar 
了 1 sar 29 Feb 5 14:25 foo 
$ ./a.out 运行 图 4.9 程 序 
$ ls -1 foo bar 检查 文件 的 权限 和 大 小 
--W------- 1 sar 0 Feb 5 14:26 bar 
--W------- 1 sar 0 Feb 5 14:26 foo 


注意 ,访问 权限 没有 改变 ， 但 是 文件 长 度 截 短 了 。 
目录 的 长 度 从 来 不 会 是 9， 因 为 它 总 是 包含 .和 . .两 项 。 符 号 链接 的 长 度 指 其 路 径 名 包含 
的 字符 数 ， 由 于 路 径 名 中 至 少 有 一 个 字符 ， 所 以 长 度 也 不 为 0。 
当 创 建新 的 core 文 件 时 ， 内 核对 其 访问 权限 有 一 个 默认 设置 ， 在 本 例 中 是 rw-r--r--。 
这 一 默认 值 可 能 会 也 可 能 不 会 被 umask 的 值 修改 。shell 对 创建 的 重 定向 的 新 文件 也 有 一 
个 默认 的 访问 权限 ， 本 例 中 为 rw-rw-rw-， 并 且 这 个 值 总 是 被 当前 的 umask 修 改 ， 本 例 
中 umask 为 02。 
不 能 使 用 du 的 原因 是 它 需 要 文件 名 ， 如 

du tempfile 
或 目录 名 ， 如 

du . 
只 有 当 un1link 函 数 返 回 时 才 释 放 tempfile 的 目录 项 ，du .命令 没有 计算 仍然 被 
tempfile 占 用 的 空间 。 本 例 中 只 能 使 用 af 命令 查看 文件 系统 中 实际 可 用 的 空闲 空间 。 
如 果 被 删除 的 链接 不 是 该 文件 的 最 后 一 个 链接 ， 则 不 会 删除 该 文件 。 此 时 ， 文 件 的 状态 
改变 时 间 被 更 新 。 但 是 ， 如 果 被 删除 的 链接 是 最 后 一 个 链接 ， 则 该 文件 将 被 物理 删除 。 
这 时 再 去 更 新 文件 的 状态 改变 时 间 就 没有 意义 ， 因 为 包含 文件 所 有 信息 的 i 节 点 将 会 随 着 
文件 的 删除 而 被 释放 。 
用 opendir 打 开 一 个 目录 后 ， 递 归 调 用 函数 dopath。 假 设 opendir 使 用 一 个 文件 描述 
符 ， 并 且 只 有 在 处 理 完 目录 后 才 调用 closedir 释 放 描述 符 ， 这 就 意味 着 每 次 降 一 级 就 
要 使 用 另外 一 个 描述 符 。 所 以 进程 可 打开 的 最 大 描述 符 数 就 限制 了 我 们 可 以 遍历 的 文件 
系统 树 的 深度 。 注 意 ，Single UNIX Specification 的 XSI 扩 展 中 说 明 的 Etw 人 允许 调用 者 指定 
使 用 的 描述 符 数 ， 这 隐 含 着 可 以 关闭 描述 符 并 且 重 用 它们 。 
chroot Rae Al Fw x EERE (Internet File Transfer Program , FTP) 用 于 辅助 安 
全 性 。 系 统 中 没有 账号 的 用 户 〈 也 称 为 匿名 FTP) 放 在 一 个 单独 的 目录 下 ， 利 用 chroot 
将 此 目录 当 作 新 的 根 目 录 就 可 以 阻止 用 户 访问 此 目录 以 外 的 文件 。 

chroot 也 用 于 在 另 一 台 机 器 上 构造 文件 系统 层次 结构 的 一 个 副本 , 然后 修改 此 副本 ， 
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但 不 更 改 原来 的 文件 系统 。 这 可 用 于 测试 新 软件 包 的 安装 。 

chroot 只 能 由 超级 用 户 执 行 ， 一 且 更 改 了 一 个 进程 的 根 目 录 ， 该 进程 及 其 后 代 进 程 
就 再 也 不 能 恢复 至 原先 的 根 目录 。 
首先 ， 调 用 stat 函 数 取 得 文件 的 三 个 时 间 值 ， 然 后 调用 utime 设 置 期 望 的 值 。 在 调用 
utime 时 我 们 不 希望 改变 的 值 应 当 是 stat 中 相应 的 值 。 
finger(1) 命 令 对 邮箱 调用 stat 函 数 ， 最 近 一 次 修改 的 时 间 是 上 一 次 接收 邮件 的 时 间 ， 
最 近 存 取 时 间 是 上 一 次 读 邮 件 的 时 间 。 
cpio 和 tazr 存 储 的 只 是 归档 的 修改 时 间 (st_mtime)。 因 为 文件 归档 时 一 定 会 读 它 ， 所 
以 该 文件 的 存 取 时 间 对 应 于 创建 归档 的 时 间 ， 为 此 没有 存放 其 存 取 时 间 。cpio 的 -a 选 项 
可 以 在 读 输 入 文件 后 重新 设置 该 文件 的 存 取 时 间 ， 于 是 创建 归档 不 改变 文件 的 存 取 时 间 。 
(但 是 ， 重 新 设置 文件 的 存 取 时 间 确 实 改变 了 状态 更 改 时 间 。) 状态 更 改 时 间 没 有 存放 在 
文档 上 ， 因 为 在 抽取 文件 时 即使 它 曾 被 归档 ， 在 抽取 时 也 不 能 设置 其 值 。(utime 函 数 可 
以 更 改 的 仅 是 存 取 时 间 和 修改 时 间 。) 

对 tar 来 说 ， 在 抽取 文件 时 ， 共 默认 方式 是 复原 归档 时 的 修改 时 间 值 ， 但 是 m 选 项 则 
将 修改 时 间 设 置 为 抽取 文件 时 的 时 间 ， 而 不 是 复原 归档 时 的 修改 时 间 值 。 对 于 tar， 无 论 
何 种 情况 ， 在 抽取 后 ， 文 件 的 存 取 时 间 均 是 抽取 文件 时 的 时 间 。 

另 一 方面 ，cpio 将 存 取 时 间 和 修改 时 间 设 置 为 抽取 文件 时 的 时 间 。 上 默认 情况 下 ， 它 
并 不 试图 将 修改 时 间 设 置 为 归档 时 的 值 。cpio 的 -m 选 项 将 文件 的 修改 时 间 和 存 取 时 间 都 
设置 为 归档 时 的 值 。 
内 核对 目录 树 的 深度 没有 内 在 的 限制 ， 但 是 如 果 路 径 名 的 长 度 超出 了 PATH_MRAX， 则 有 
许多 命令 会 失败 。 程 序 清单 C-2 中 的 程序 创建 了 一 个 深度 为 100 的 目录 树 ， 每 一 级 目录 名 
有 45 个 字符 。 在 所 有 平台 上 我 们 都 能 构建 这 样 的 结构 ， 但 是 却 不 能 在 所 有 平台 上 用 
getcwd 都 得 到 第 100 级 目录 的 绝对 路 径 名 。 在 Linux 2.4.22 和 Solaris 9 中 ， 当 到 达 长 路 径 
的 目录 结尾 时 ，getcwd 就 不 再 能 继续 正常 工作 。 在 FreeBSD 5.2.1 和 Mac OS X 10.3 中 ， 
getcwd 可 以 获得 路 径 名 ,但 是 需要 多 次 调用 realloc 得 到 一 个 足够 大 的 缓冲 区 。 在 
FreeBSD 5.2.1 上 运行 该 程序 后 得 到 


$ ./a.out 
getcwd failed, size - 1025: Result too large 
getcwd failed, size - 1125: Result too large 
"T 33 行 
getcwd failed, size = 4525: Result too large 
length = 4610 

显示 4610 字 节 的 路 径 名 


但 是 由 于 文件 名 太 长 ， 不 能 用 tar 或 cpio 对 该 目录 建立 档案 文件 ， 它 们 都 “抱怨 ”文件 
名 太 长 了 。 


程序 清单 C-2 创建 深 目录 树 


#include "apue.h" 
#include «fcntl.h» 


#define DEPTH 100 /* directory depth */ 
#define MYHOME  "/home/sar" 
#define NAME "alonglonglonglonglonglonglonglonglonglongname" 


#define MAXSZ 8192 
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int 

main (void) 

{ 
int i, size; 
char *path; 


if (chdir (MYHOME) < 0) 
err_sys("chdir error"); 


for (i = 0; i « DEPTH; i++) { 
if (mkdir(NAME, DIR MODE) « 0) 
err sys("mkdir failed, i = td", i); 
if (chdir(NAME) « 0) 
err sys("chdir failed, i = td", i); 


if (creat("afile", FILE MODE) « 0) 
err_sys("creat error"); 


/* 
* The deep directory is created, with a file at the leaf. 
* Now let's try to obtain its pathname. 


x/ 
path = path alloc(&size); 
for (; ; 9 { 
if (getcwd(path, size) !- NULL) ( 
break; 
} else { 


err ret ("getcwd failed, size = $d", size); 
size += 100; 
if (size > MAXSZ) 
err quit ("giving up"); 
! if ((path = realloc(path, size)) == NULL) 
` err_sys("realloc error"); 
} 
} 


printf ("length = %d\n%s\n", strlen(path), path); 


exit (0); 


} 


417 /dev 目 录 关 闭 了 一 般 用 户 的 写 访问 权限 ， 以 避免 用 户 删除 目录 中 的 文件 ， 这 就 意味 着 
unlink 失 败 。 


第 5 章 


5.2 fgets 函 数 读 入 数据 ， 直 到 行 结束 或 缓冲 区 满 (当然 会 留 出 一 个 字 节 存放 终止 字符 )。 同 
样 ，fputs 只 负责 将 缓冲 区 中 的 内 容 输出 ， 而 并 不 考虑 缓冲 区 中 是 否 包含 换行 符 。 所 以 ， 
如 果 将 MAXLINE 设 得 太 小 ， 这 两 个 函数 仍然 会 正常 工作 ， 只 不 过 被 执行 的 次 数 要 比 


MAXLINE 值 较 大 的 时 候 多 。 
如 果 这 些 函 数 删除 或 添加 换行 符 〈 如 gets 和 puts)， 则 必须 保证 对 于 最 长 的 行 ， 缓 
359 冲 区 也 足够 大 。 


geol 53 当 printf 没 有 输出 任何 字符 时 ， 如 printf("") ， 则 返回 0。 
5.4 这 是 一 个 比较 常见 的 错误 。getc 以 及 getchar 的 返回 值 都 是 整 型 ， 而 不 是 字符 型 。 由 于 
EOF 经 常 定义 为 ~1， 那 么 如 果 系 统 使 用 的 是 有 符号 的 字符 类 型 ， 程 序 还 可 以 正常 工作 。 
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但 如 果 使 用 的 是 无 符号 字符 类 型 ， 那 么 返回 的 EOF 被 保存 到 字符 c 后 将 不 再 是 一 1， 所 以 ， 
程序 会 进入 死 循环 。 本 书 描述 的 四 种 平台 都 使 用 带 符号 字符 ， 所 以 实例 代码 都 能 工作 。 

5 个 字符 长 的 前 经 、4 个 字符 长 的 进程 内 唯一 标识 再 加 5 个 字符 长 的 系统 内 唯一 标识 (进程 
ID) 刚好 组 成 14 位 的 UNIX 传 统 文件 名 长 度 限 制 。 


5.6 使 用 方法 为 : 先 调 用 ff1ush 后 调用 fsync，fsync 的 参数 由 fileno 国 数 获得 。 如 果 不 


调用 fflush， 所 有 的 数据 仍然 在 内 存 缓冲 区 中 ， 此 时 调用 fsync 将 没有 任何 效果 。 


5.7 当 程 序 交互 运行 时 ， 标 准 输入 和 标准 输出 均 为 行 缓 冲 方式 。 每 次 调用 fgets 时 标准 输出 


设备 将 自动 刷 清 。 


第 6 章 


6.1 


6.2 


6.3 节 论述 了 在 Linux 和 Solaris 系 统 中 存 取 阴 影 口令 文件 的 函数 。 我 们 不 能 使 用 6.2 节 所 述 函 
数 返 回 的 pw_passwd 字 段 值 与 加 密 口令 相 比 较 。 正 确 的 方法 是 使 用 阴影 口令 文件 中 对 应 
用 户 的 加 窗口 令 来 进行 比较 。 

在 FreeBSD 和 Mac OS XX， 口 令 文 件 的 阴影 是 自动 建立 的 。getpwnam 或 getpwuid 函 
数 返回 的 passed 结 构 中 ，pw_passwd 字 有 段 包含 加 密 口令 (在 FreeBSD, 仅 当 调用 者 的 
有 效用 户 ID 为 0 时 )。 
在 Linux 和 Solaris 中 ， 程 序 清单 C-3 中 的 程序 输出 加 密 口 令 。 当 然 ， 除 非 有 超级 用 户 权 限 ， 
否则 调用 getspnam 将 返回 EACCES 错 误 。 


程序 清单 C-3 在 SVR4 系 统 中 输出 加 密 口令 
#include "apue.h" 
#include <shadow.h> 
int 
main (void) /* Linux/Solaris version */ 
struct spwd *ptr; 


if ((ptr = getspnam("sar")) == NULL) 
err_sys("getspnam error") ; 
printf ("sp_pwdp = %s\n", ptr->sp_pwdp == NULL | | 
ptr-»sp pwdpí0] == 0 ? "(null)" : ptr-»sp pwdp); 
exit(0); 


在 FreeBSD 中 ， 若 以 超级 用 户 权 限 运 行 这 个 程序 ， 程 序 清单 C-4 中 的 程序 将 输出 加 密 
H4, 否则 pw_passed 的 返回 值 为 星 号 (*)。 在 Mac OS X， 不 管 其 运行 时 的 用 户 权 限 是 
什么 都 输出 加 密 口 令 。 


程序 清单 C-4 在 FreeBSD 和 Mac OS X 中 输出 加 密 口令 


#include "apue.h" 
#include <pwd.h> 


int 
main (void) /* FreeBSD/Mac OS X version */ 
struct passwd *ptr; 


if ((ptr = getpwnam("sar")) == NULL) 
err sys("getpwnam error"); 
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6.5 


printf ("pw passwd = %s\n", ptr-»pw passwd == NULL | | 
ptr-»pw passwd[0] == 0 ? "(null)" : ptr-»pw passwd); 
exit(0); 


程序 清单 C-5 中 的 程序 以 类 似 于 date 的 格式 输出 日 期 。 
程序 清单 C-5 以 类 似 于 gate(1) 的 格式 输出 日 期 和 时 间 


#include "apue.h" 
#include <time.h> 
int 

main (void) 


time_t caltime; 
struct tm *tm; 
char line [MAXLINE]; 


if ((caltime = time(NULL)) == -1) 
err sys("time error"); 

if ((tm = localtime (&caltime)) == NULL) 
err_sys ("localtime error"); 

if (strftime(line, MAXLINE, “ta %b %d *X *Z &Y\n", tm) == 0) 
err_sys("strftime error"); 

fputs(line, stdout); 


exit (0); 
} 
程序 清单 C-5 中 的 程序 的 运行 结果 如 下 : 
$ ./a.out 作者 的 默认 格式 是 在 美国 东部 
Sun Feb 06 16:53:57 EST 2005 
$ TZ«US/Mountain ./a.out 美国 山地 时 区 
Sun Feb 06 14:53:57 MST 2005 
$ TZeJapan ./a.out 日 本 


Mon Feb 07 06:53:57 JST 2005 


第 7 章 


7.1 


7.2 


7.3 


7.4 
7.5 


7.6 
7.7 


原因 在 于 printf 的 返回 值 ( 输 出 的 字符 数 ) 变 成 了 main 函 数 的 返回 值 。 当 然 ， 并 不 是 
所 有 的 系统 都 会 出 现 该 情况 。 

当 程 序 处 于 交互 运行 方式 时 ， 标 准 输 出 通常 处 于 行 缓冲 方式 ， 所 以 当 输 出 换行 符 时 ， 上 
次 的 结果 才 被 真正 输出 。 如 果 标 准 输出 被 定向 到 一 个 文件 而 处 于 完全 缓冲 方式 ， 则 当 标 
VOR REAM, SRA AER. 

由 于 agrc 和 argv 的 副本 不 像 environ 一 样 保存 在 全 局 变量 中 ， 所 以 在 大 多 数 UNIX 系 统 
中 没有 办 法 做 到 这 一 点 。 

当 C 程 序 解 引 用 一 个 空 指针 出 错时 ， 这 种 方法 终止 进程 。 

定义 如 下 : 

typedef void Exitfunc (void) ; 


int atexit(Exitfunc *func) ; 


calloc 将 分 配 的 内 存 空间 初始 化 为 0。 但 是 ISO C 并 不 保证 0 值 与 浮 点 0 或 空 指针 的 值 相同 。 
只 有 通过 exec 国 数 执行 一 个 程序 时 ， 才 会 分 配 堆 和 堆栈 ( 见 8.10 节 )。 
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7.8 可 执行 文件 (a.out) 包含 了 用 于 调试 core 文 件 的 符号 表 信 息 ， 用 strip() 命 令 可 以 删 
除 这 些 信息 ， 对 两 个 a. out 文件 执行 这 条 命令 ， 它 们 的 大 小 分 别 减 为 381 976 和 2 912 字 节 。 

7.9 没有 使 用 共享 库 时 ， 可 执行 文件 的 大 部 分 都 被 标准 MO 库 所 占用 。 

7.10 这 段 代码 不 正确 。 因 为 在 复合 语句 中 定义 了 自动 变量 val ， 当 该 复合 语句 结束 时 ， 变 量 
val 就 不 存在 了 ， 而 这 段 代码 通过 指针 引用 了 已 经 不 存在 的 自动 变量 val。 


第 8 章 
8.1 为 了 仿真 子 进程 终止 时 关闭 标准 输出 的 行为 ， 在 调用 exit 之 前 加 下 面 一 行 ; 


fclose (stdout) ; 
为 了 观察 其 效果 ， 用 下 面 几 行 代替 程序 中 调用 printf 的 语句 ， 


i = printf ("pid = %d, glob = td, var = %d\n", 
getpid(), glob, var); 

sprintf (buf, "%d\n", i); 

write (STDOUT_FILENO, buf, strlen(buf)); 


注意 也 要 定义 变量 1 和 puf。 

这 里 假设 子 进程 调用 exit 时 关闭 标准 WO 流 , 并 不 关闭 文件 描述 符 STDOUT_FILENO。 
有 些 版 本 的 标准 1/O 库 会 关闭 与 标准 输出 相关 联 的 文件 描述 符 从 而 引起 write 标 准 输出 失 
败 ， 在 这 种 情况 ， 调 用 aup 将 标准 输出 复制 到 另 一 个 描述 符 ，write 则 使 用 新 复制 的 文 
件 描述 符 。 

8.2 可 以 通过 程序 清单 C-6 中 的 程序 来 说 明 这 个 问题 。 
程序 清单 C-6 ”错误 使 用 vfork 的 例子 

#include "apue.h" 
static void fi(void), f2(void); 
int 
main(void) 


£1(); 
£20); 
_exit (0); 


} 


static void 
£1 (void) 
{ 


pid t pid; 


if ((pid = vfork()) « 0) 
err sys("vfork error"); 
/* child and parent both return */ 


) 


static void 


£2 (void) 
char buf [1000]; /* automatic variables */ 
int i; 


for (i = 0; i < sizeof (buf); i++) 
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8.3 


8.4 


8.5 
8.6 


buf [i] = 0; 


当 函 数 f1 调 用 vfork 时 ， 父 进程 的 栈 指 针 指向 £1 函数 的 栈 帧 ， 见 图 C-2。 

vfork 使 得 子 进程 先 执行 然后 从 f1 返 回 ， 接 着 子 进程 调用 f2， 并 且 f2 的 栈 帧 覆盖 了 
£1 的 栈 帧 , 在 £2 中 子 进程 将 自动 变量 buf 的 值 置 为 0, 即将 栈 中 的 1000 个 字 节 的 值 都 置 为 0。 
从 f2 返 回 后 子 进程 调用 _exit， 这 时 栈 中 main 栈 帧 以 下 的 内 容 已 经 被 £2 修改 了 。 然 后 ， 
父 进程 从 vfork 调 用 后 继续 ， 并 从 f1 返 回 。 返 回信 息 虽 然 常 常 保存 在 栈 中 ， 但 是 多 半 可 能 
已 经 被 子 进程 修改 了 。 对 于 这 个 例子 ， 父 进程 恢复 继续 执行 的 结果 要 依赖 于 你 所 使 用 的 
UNIX 系 统 的 实现 特征 。( 如 返回 信息 保存 在 栈 帧 中 的 具体 位 置 ， 修 改动 态 变量 时 覆盖 了 哪 
些 信息 ， 等 等 。) 通常 的 结果 是 一 个 core 文 件 ， 但 在 你 的 系统 上 产生 的 结果 可 能 不 同 。 


栈 的 底部 
main 的 栈 帧 


f1 的 栈 帧 





栈 扩 展 的 方向 | 


图 C-2 调用 vfork 时 的 栈 帧 


在 程序 清单 8-7 中 ， 我 们 先 让 父 进程 输出 ， 但 是 当 父 进程 输出 完毕 子 进程 要 输出 时 ， 要 让 
父 进 程 终止 。 是 父 进程 先 终止 还 是 子 进程 先 执行 输出 要 依赖 于 内 核对 两 个 进程 的 调度 
( 另 一 个 竞争 条 件 )。 在 父 进程 终止 后 ，shell 会 开始 执行 下 一 个 程序 ， 它 也 许 会 干扰 子 进 
程 的 输出 。 为 了 避免 这 种 情况 ， 要 在 子 进程 完成 输出 后 才 终 止 父 进程 。 用 下 面 的 语句 替 
换 程序 中 fork 后 面 的 代码 。 


else if (pid == 0) { 


WAIT PARENT () ; /* parent goes first */ 
charatatime("output from child\n"); 
TELL_PARENT (getppid()); /* tell parent we're done */ 

) eise ( 
charatatime ("output from parent\n") ; 
TELL_CHILD (pid) ; /* tell child we're done */ 
WAIT CHILD(); /* wait for child to finish */ 


} 

由 于 只 有 终止 父 进程 才能 开始 下 一 个 程序 ， 而 该 程序 让 子 进程 先 运行 ， 所 以 不 会 出 现 上 
面 的 情况 。 

对 argv[21] 打 印 的 是 相同 的 值 (/home/stevens/bin/testinterp)。 原 因 是 
execlp 在 结束 时 调用 了 execve， 并且 与 直接 调用 execl 的 路 径 名 相同 。 回 忆 图 8-2。 

不 提供 返回 保存 的 设置 用 户 ID 的 函数 ， 我 们 必须 在 进程 开始 时 保存 有 效 的 用 户 ID。 

程序 清单 C-7 中 的 程序 创建 了 一 个 伟 死 进程 。 


程序 清单 C-7 创建 一 个 伪 死 进程 并 用 ps 查看 其 状态 


#include "apue.h" 


#ifdef SOLARIS 
#define PSCMD "ps -a -o pid,ppid,s,tty,comm" 
#else 
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#define PSCMD 
#endif 


"ps -o pid,ppid, state, tty, command" 


int 
main (void) 


{ 
pid t pid; 
if ((pid = fork()) « 0) 
err sys("fork error"); 
else if (pid -- 0) /* child */ 
exit (0); 


/* parent */ 
sleep (4); 
system (PSCMD) ; 


exit (0); 


} 


执行 程序 结果 如 下 (ps(D 用 z 表 示 僵 死 进程 ) ; 


$ ./a.out 

PID PPID S TT COMMAND 
3395 3264 S pts/3 bash 
29520 3395 S pts/3 ./a.out 


29521 29520 2 pts/3 
29522 29520 R pts/3 
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[a.out] <defunct> 
ps -o pid,ppid,state,tty, command 


9.1 因为 init 进 程 是 登录 shell 的 父 进程 ， 当 登录 shell 终 止 时 它 收 到 STGCHLD 信 号 量 ， 所 以 


init 进 程 知道 什么 时 候 终端 用 户 注销 。 


网 络 登录 没有 包含 init ， 在 utmp 和 wtmp 文 件 中 的 登录 项 和 相应 的 注销 项 是 由 一 个 


处 理 登录 并 监测 注销 的 进程 写 的 (本 例 中 为 Lelnetd)。 
第 10 章 


10.1 当 程 序 第 一 次 接收 到 发 送 给 它 的 信号 量 时 就 终止 了 。 因 为 一 捕捉 到 信号 ，pause 函 数 就 




















返回 。 
10.2 图 C-3 给 出 了 这 些 栈 帧 。 
处 理 处 理 
SIGINT SIGALRM 
栈 的 底部 
main 的 栈 帧 main 的 栈 帧 main 的 栈 帧 
| | | sig_inthy sig intffj i ] 
Fui b "REP 








sig alrmffj 


栈 帧 





图 C-3 longjmp 前 后 的 栈 帧 
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10.4 


10.5 


10.7 
10.8 


10.10 


10.11 


10.12 
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在 sig_alrm 中 通过 1ongjmp 返 回 main， 有 效 地 避免 了 继续 执行 sig_int。 
在 第 一 次 调用 alarm 和 调用 setjmp 之 间 又 有 一 个 竞争 条 件 。 如 果 进 程 在 调用 alarm 和 
setjmp 之 间 被 内 核 阻 塞 了 ， 闹 钟 时 间 超 过 后 就 调用 信号 量 处 理 程序 ， 然 后 调用 
longjmp。 但 是 由 于 没有 调用 过 setjmp， 所 以 没有 设置 env_alrm 绿 冲 区 。 如 果 
longjmp 的 跳 转 缓冲 区 没有 被 setjmp 初 始 化 ， 则 说 明 1longjmp 的 操作 是 未 定义 的 。 
参见 Don Libes 的 “Implementing Software Timers” (C Users Journal, vol.8, no.11, 
Nov.1990) 中 的 例子 。 
如 果 仅 仅 调用 _exit， 则 进程 终止 状态 不 能 表示 该 进程 是 由 于 SIGABRT 信 号 量 而 终止 的 。 
如 果 信 和 号 是 由 其 他 用 户 的 进程 发 出 的 ， 进 程 必 须 是 设置 用 户 ID 为 根 的 或 者 是 接收 进程 的 
所 有 者 ， 否 则 kil11 不 能 执行 。 所 以 实际 用 户 ID 为 信号 的 接收 者 提供 了 更 多 的 信息 。 
对 于 本 书 作者 所 用 的 一 个 系统 ， 大 约 每 60~90 分 钟 增 加 一 秒 ， 这 个 误差 是 因为 每 次 调用 
sleep 都 要 调度 一 次 将 来 时 间 的 事件 ， 但 是 由 于 CPU 调度 ， 有 时 并 没有 在 事件 发 生 时 立 
即 被 唤醒 。 另 外 一 个 原因 是 进程 开始 运行 和 再 次 调用 sleep 都 需要 一 定量 的 时 间 。 
cron 守 护 进 程 这 样 的 程序 每 分 钟 都 要 取 当 前 时 间 ， 而 且 它 首先 设置 一 个 休眠 周期 ， 
然后 在 下 一 分 钟 开 始 时 唤醒 。 大 多 数 调用 是 sleep (60) ， 偶 尔 有 一 个 sleep (59) 用 于 
在 下 一 分 钟 同步 。 但 是 若 在 进程 中 花费 了 许多 时 间 执 行 命令 或 者 系统 的 负载 重 、 调 度 慢 ， 
这 时 休眠 值 可 能 远 小 于 60。 
在 Linux 2.4.22 和 Solaris 9 中 ， 从 来 没有 调用 过 sIGXFSz 的 信和 号 量 处 理 程序 ， 但 一 旦 文件 
的 大 小 达到 1024 守 节 时 ，write 就 返回 24。 
在 FreeBSD 5.2.1 和 Mac OS X 10.3 中 ,文件 大 小 已 达到 1000 字 节 ， 下 一 次 企图 写 100 字 
节 时 调用 该 信号 处 理 程序 ，write 调 用 返回 -1 并 且 errno 设 置 为 BFBIG (“文件 太 大 ”)。 
结果 与 标准 WO 库 的 实现 有 关 : fwrite 如 何 处 理 一 个 被 中 断 的 写 。 
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11.1 


程序 清单 C-8 给 出 了 一 个 没有 使 用 自动 变量 ， 而 采用 动态 内 存 分 配 的 程序 。 
程序 清单 C-8 线程 返回 值 的 正确 使 用 


#include "apue.h" 
#include «pthread.h» 


struct foo { 
int a, b, c, d; 
) 
void 
printfoo(const char *s, const struct foo *fp) 


printf (s); 
printf(" structure at 0x%x\n", (unsigned)fp); 
printf(" foo.a = %d\n", fp->a); 


printf(" foo.b = &d\n", fp->b); 
printf(" foo.c = &d\n", fp->c); 
printf(" foo.d = d\n", fp->d); 

} 

void * 

thr _fni(void *arg) 

{ 
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11.3 


11.4 
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struct foo *fp; 


if ((fp = malloc (sizeof (struct foo))) == NULL) 
err_sys("can’t allocate memory") ; 

fp-»a 1; 
fp-»b 
fp-»c 
fp-»d 
printfoo("thread:\n", fp); 
return((void *)fp): 

) 

int 

main (void) 


2; 
3; 
4; 
( 


int err; 
pthread t tidl; 
struct foo *fp; 


err - pthread create(&tidl, NULL, thr fni, NULL); 
if (err != 0) 

err exit(err, "can't create thread 1"); 
err = pthread join(tidl, (void *)&fp); 
if (err != 0) 

err exit(err, "can't join with thread 1"); 
printfoo("parent:\n", fp); 
exit(0); 


) 


要 修改 未 决 作业 的 线程 ID， 必 须 持 有 写 模 式 下 的 读 写 锁 ， 防 止 ID 在 改变 过 程 中 有 其 他 线 


程 在 搜索 该 列表 。 目 前 定义 该 接 只 的 方式 存在 的 问题 在 于 : 调用 job_find 找 到 该 作业 以 
及 调用 job_remove 从 列表 中 删除 该 作业 这 两 个 时 间 之 间作 业 ID 可 以 改动 。 这 个 问题 可 
以 通过 在 job 结构 中 代入 引用 计数 和 互 斥 量 ， 然 后 让 job_fina 增 加 引用 计数 的 方法 来 解 
决 。 这 样 修改 卫 的 代码 就 可 以 避免 对 列表 中 非 零 引 用 计数 的 任何 作业 进行 了 p 改 动 的 情况 。 
首先 ， 列 表 是 由 读 写 锁 保护 的 ， 但 条 件 变 量 需要 互 斥 量 对 条 件 进 行 保 护 ， 其 次 ， 每 个 线 
程 等 待 满足 的 条 件 应 该 是 有 某 个 作业 进行 处 理 时 需要 的 条 件 ， 所 以 需要 创建 每 线程 数据 
结构 来 表示 这 个 条 件 。 或 者 ， 可 以 把 互 斥 量 和 条 件 变 量 幅 人 到 queue 结 构 ， 但 这 意味 着 
所 有 的 工作 线程 都 将 等 待 相同 的 条 件 。 如 果 有 很 多 工作 线程 存在 ， 当 唤醒 了 许多 线程 但 
又 没有 工作 可 做 时 ， 就 可 能 出 现 惊 群 效应 (thundering herd) 问题 ， 最 后 导致 CPU 资源 
的 浪费 ， 并 且 增 加 了 锁 的 争夺 。 

这 根据 具体 情况 而 定 。 总 的 来 说 ， 两 种 情况 都 可 能 是 正确 的 ， 但 每 一 种 方法 都 有 不 足 之 
处 。 在 第 一 种 情况 下 ,调用 pthread_cond_pbroadcast 以 后 ， 等 待 线程 会 被 调度 以 
运行 。 如 果 程序 运行 在 多 处 理 机 上 ， 由 于 还 持 有 互 斥 锁 (pthread cond waickElfe 
有 的 互 斥 锁 ) ， 一 些 线程 就 会 运行 而 且 马 上 阻塞 。 在 第 二 种 情况 下 ， 运 行 线程 可 以 在 第 3 
步 和 第 4 步 之 间 获 取 互 斥 锁 ， 然 后 使 条 件 失 效 ， 最 后 释放 互 斥 锁 ， 接 着 ， 当 调用 
pthread_cond_broadcast 时 ， 条 件 不 再 为 真 ， 线 程 无 需 运行 。 这 就 是 为 什么 唤醒 
线程 必须 重新 检查 条 件 ， 不 能 仅仅 因为 pthread_cond_wait 返 回 就 假定 条 件 为 真 。 


第 12 章 


12.1 


就 像 人 们 首先 会 猜 到 的 ， 这 并 不 是 一 个 多 线程 问题 。 这 些 标准 VO 例 程 事实 上 是 线程 安 
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12.3 


12.4 


12.5 
12.6 


12.7 


ARC 部 分 习题 答案 


全 的 。 调 用 fork 时 ， 每 个 进程 获得 了 标准 IO 数据 结构 的 一 个 副本 。 程 序 运行 时 把 标准 
输出 定向 到 终端 时 ， 输 出 是 行 缓冲 的 ， 所 以 每 次 打印 一 行 时 ， 标 准 MO 库 就 把 该 行 写 到 
终端 上 。 但 是 ， 如 果 把 标准 输出 重 定向 到 文件 的 话 ， 则 标准 输出 就 是 全 缓冲 的 。 当 缓冲 
区 满 或 者 进程 关闭 流 时 ， 输 出 才 会 写 到 文件 。 在 这 个 例子 中 执行 Eork 时 ， 缓 冲 区 中 包 
含 了 还 未 写 的 几 个 打印 行 ， 所 以 当 父 进程 和 子 进程 最 终 把 缓冲 区 中 的 副本 冲洗 时 ， 最 初 
的 复制 内 容 就 写 人 文件 。 

理论 上 来 讲 ， 如 果 在 信号 处 理 程序 运行 时 阻塞 所 有 的 信和 号， 那么 就 能 使 函数 成 为 异步 信 
号 安全 的 。 问 题 是 我 们 并 不 能 知道 调用 的 某 个 函数 可 能 并 没有 屏蔽 已 经 被 阻塞 的 信和 号， 
这 样 可 能 通过 另 一 个 信号 处 理 程序 使 得 该 函数 变 成 可 重 人 的 。 

在 FreeBSD 5.2.1 上 ， 会 得 到 一 连 串 错误 信息 ， 然 后 过 一 段 时 间 ， 程 序 抛 出 core 文 件 。 
用 gdp 的话 可 以 看 到 程序 在 初始 化 阶段 就 陷 人 无 限 循环 。 程 序 初始 化 过 程 将 调用 线程 初 
始 化 函数 ， 这 会 调用 到 mal1oc。 而 ma11oc 函 数 反 过 来 会 调用 getenv 找 到 环境 变量 
MRLLOC_OPTIONS 的 值 。 我 们 对 getenv 的 实现 调用 了 pos ix 线程 函数 ，posix 线 程 函 
数 会 试图 调用 线程 初始 化 函数 。 最 终 会 出 现 错误 ， 在 调用 abort 以 后 陷 和 人 类 似 的 无 限 循 
环 。 经 过 几 十 万 左右 的 栈 帧 以 后 ， 进 程 退出 并 产生 core 转 储 。 

如 果 和 希望 在 一 个 程序 中 运行 另 一 个 程序 ( 即 在 调用 exec 之 前 ) ， 还 需要 fork。 

程序 清单 C-9 给 出 了 使 用 select 实 现 线程 安全 的 sleep 函 数 ， 延 迟 一 定数 量 的 时 间 。 它 
是 线程 安全 的 ， 因 为 它 并 不 使 用 任何 未 经 保护 的 全 局 或 静态 数据 ， 并 且 只 调用 其 他 线程 
安全 的 函数 。 


程序 清单 C-9 sleep 的 线程 安全 实现 


#include <unistd.h> 
#include <time.h> 
#include «sys/select.h» 


unsigned 
sleep (unsigned nsec) 


int n; 

unsigned slept; 
time_t start, end; 
struct timeval tv; 


tv.tv_sec = nsec; 
tv.tv_usec = 0; 
time (&start) ; 
n = select (0, NULL, NULL, NULL, &tv); 
if (n == 0) 
return(0); 
time(&end); 
Slept - end - start; 
if (slept >= nsec) 
return(0); 
return(nsec - slept); 
) 
SSeS 


很 多 时 候 条 件 变 量 的 实现 都 使 用 互 斥 锁 来 保护 它 的 内 部 结构 ， 由 于 这 是 实现 细节 因而 通常 
是 被 隐藏 起 来 的 ， 所 以 在 forkx 处 理 程序 中 没有 可 移植 的 方法 获取 或 释放 锁 。 既 然 在 调用 
fork 后 并 不 能 确定 条 件 变 量 中 的 内 部 锁 状 态 ， 所 以 在 子 进程 中 使 用 条 件 变 量 是 不 安全 的 。 
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13.1 如 果 进 程 调用 chroot ， 它 就 不 能 打开 /dev/1og。 解 决 的 办 法 是 ， 守 护 进程 在 调用 
chroot 之 前 调用 选项 为 LOG_NDELAY 的 openlog。 它 打开 特殊 设备 文件 (UNIX 域 数据 
REET) 并 生成 一 个 描述 符 ， 即 使 调用 了 chroot 之 后 ， 该 描述 符 仍然 是 有 效 的 。 这 种 
情景 在 ftpa (File Transfer Protocol daemon) 这 样 的 守护 进程 中 是 会 磁 到 的 ， 为 安全 性 原 
因 ， 它 们 调用 chroot， 但 仍 需 调用 sys1log 以 记录 出 错 条 件 。 

13.3. 程序 清单 C-10 程 序 是 一 种 解决 方案 。 其 结果 依赖 于 不 同 的 系统 实现 。 请 回忆 ，daemonize 
关闭 所 有 打开 文件 描述 符 ， 然 后 向 /dev /null 再 打开 前 3 个 。 这 意味 着 进程 不 再 有 控制 
终端 ， 所 以 get1login 不 能 在 utmp 文 件 中 看 到 进程 的 登录 项 。 于 是 在 Linux 2.4.22 和 |870 
Solaris 9， 我 们 发 现 守护 进程 没有 登录 名 。 871 


程序 清单 C-10 调用 daemon init 获 得 注册 名 
#include "apue.h" 
int 
main (void) 
FILE *fp; 
char *p; 


daemonize ("getlog") ; 
p = getlogin(); 
fp = fopen("/tmp/getlog.out", "w"); 
if (fp != NULL) { 
if (p == NULL) 
fprintf(fp, "no login nameMn"); 
else 
fprintf (fp, "login name: %s\n", p); 


exit(0); 


但 是 在 FreeBSD 5.2.1 和 Mac OS X 10.3 中 ， 登 录 名 是 由 进程 表 维 护 的 ， 并 且 在 执行 
fork 时 复制 。 也 就 是 说 ， 除 非 其 父 进程 没有 登录 名 (如 系统 自 引导 时 调用 init)， 否 则 
进程 总 能 获得 其 登录 名 。 


第 14 章 
14.1 测试 程序 示 于 程序 清单 C-11。 
程序 清单 C-11 判断 记录 锁 的 行为 


#include "apue.h" 
#include «fcntl.h» 
#include <errno.h> 


void 

sigint (int signo) 
} 

int 

main (void) 
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pid t pidl, pid2, pid3; 
int fd; 


setbuf (stdout, NULL); 
Signal intr(SIGINT, sigint); 


/* 
* Create a file. 
*/ 
if ((fd = open("lockfile", O RDWR|O CREAT, 0666)) < 0) 
err sys("can't open/create lockfile"); 
/* 
* Read-lock the file. 
*/ 
if ((pidi = fork()) < 0) { 
err sys("fork failed"); 
) else if (pidl == 0) ( /* child */ 
if (lock reg(fd, F SETLK, F RDLCK, 0, SEEK SET, 0) < 0) 
err Sys("child 1: can't read-lock file"); 
printf("child 1: obtained read lock on file\n"); 


pause (); 
printf("child 1: exit after pause\n"); 
exit(0); 
) eise ( /* parent */ 
sleep (2); 
) 
/* 
* Parent continues ... read-lock the file again. 
* 
/ 


if ((pid2 = fork()) « 0) { 
err sys("fork failed"); 
) eise if (pid2 == 0) { /* child */ 
if (lock reg(fd, F SETLK, F RDLCK, 0, SEEK SET, 0) « 0) 
err 8ys("child 2: can't read-lock file"); 
printf("child 2: obtained read lock on file\n"); 


pause (); 
printf ("child 2: exit after pause\n"); 
exit (0); 
} else { /* parent */ 
sleep (2); 
) 
/* 
* Parent continues ... block while trying to write-lock 
* the file. 
*/ 


if ((pid3 = fork()) < 0) { 
err_sys ("fork failed"); 
} else if (pid3 == 0) { /* child */ 
if (lock_reg(fd, F SETLK, F WRLCK, 0, SEEK SET, 0) « 0) 
printf("child 3: can't set write lock: $sWn", 
strerror (errno)); 
printf("child 3 about to block in write-lock...\n"); 
if (lock reg(fd, F SETLKW, F WRLCK, 0, SEEK SET, 0) « 0) 
err sys("child 3: can't write-lock file"); 
printf("child 3 returned and got write lock????\n"); 
pause () ; 
printf("child 3: exit after pause\n"); 
exit(0); 
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} else { /* parent */ 
sleep (2); 
) 


/* 
* See if a pending write lock will block the next 
* read-lock attempt. 
* 
/ 
if (lock reg(fd, F SETLK, F RDLCK, 0, SEEK SET, 0) « 0) 
printf("parent: can't set read lock: %s\n", 
Strerror(errno)); 
else 
printf("parent: obtained additional read lock while" 
" write lock is pending\n") ; 
printf ("killing child 1... Xn"); 
kill(pidi, SIGINT); 
printf("killing child 2...\n"); 
kill(pid2, SIGINT); 
printf ("killing child 3... Mn"); 
kill(pid3, SIGINT); 
exit(0); 


701 


在 本 书 说 明 的 四 种 平台 上 ， 记 录 锁 的 行为 是 相同 的 : 后 增加 的 读者 可 使 未 决 的 写 者 不 断 
等 待 。 运 行 该 程序 得 到 


child 1: obtained read lock on file 

child 2: obtained read lock on file 

child 3: can’t set write lock: Resource temporarily unavailable 
child 3 about to block in write-lock... 

parent: obtained additional read lock while write lock is pending 
killing child 1... 

child 1: exit after pause 

killing child 2... 

child 2: exit after pause 

killing child 3... 

child 3: can’t write-lock file: Interrupted system call 


14.2 大 多 数 系统 将 fd_set 定 义 为 只 包含 一 个 成 员 的 结构 ， 该 成 员 为 一 个 长 整 型 数组 。 数 组 中 
每 一 位 (bit) 对 应 于 一 个 描述 符 。4 个 FD_ 宏 通过 开 、 关 或 测试 指定 的 位 对 这 个 数组 进行 
操作 。 将 之 定义 为 一 个 包含 数组 的 结构 而 不 仅仅 是 一 个 数组 的 原因 是 : 通过 C 语 言 的 赋值 
语句 ， 可 以 使 fda_set 类 型 变量 相互 赋值 。 

14.3 大 多 数 系 统 允 许 用 户 在 包括 头 文件 <sys/types .h> 前 定义 常量 FD_SETSIZE。 例 如 ， 
下 面 的 代码 定义 fdq_set 数 据 类 型 ， 使 其 可 以 包含 2048 个 描述 符 : 


#define FD SETSIZE 2048 
#include <sys/select.h> 


这 在 FreeBSD 5.2.1, Mac OS X 10.3 和 Solaris 9 上 可 正常 工作 ， 而 Linux 2.4.22 对 此 的 处 理 
14.4 下 面 的 表 中 列 出 了 功能 类 似 的 函数 。 


FD_ZERO sigemptyset 
FD_SET sigaddset 


FD_CLR sigdelset 
FD_ISSET sigismember 
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14.5 
14.6 


14. 


- 


14.8 


WA EsigfillsetM MBSED xxx, o fee RE RORUL, TEIL fS E RRB SURE 
一 个 参数 ， 信 和 号 编号 是 第 二 个 参数 ， 对 于 描述 符 来 说 ， 描 述 符 编号 是 第 一 个 参数 ， 指 向 
描述 符 集合 的 指针 是 第 二 个 参数 。 

getmsg 最 多 返回 5 种 信息 : 数据 、 数 据 长 度 、 控 制 信息 、 控 制 信息 的 长 度 和 标志 。 

利用 select 实 现 的 程序 见 程序 清单 C-12， 利 用 po1l1 实 现 的 程序 见 程序 清单 C-13。 


程序 清单 C-12 ”用 select 实 现 eleep_use 函 数 


#include "apue.h" 

#include <sys/select.h> 

void 

Sleep us(unsigned int nusecs) 


struct timeval tval; 


tval.tv_sec = nusecs / 1000000; 
tval.tv_usec = nusecs % 1000000; 
select (0, NULL, NULL, NULL, &tval); 





程序 清单 C-13 用 pol1 实 现 eleep_us 函 数 
#include <poll.h> 
void 
Sleep us(unsigned int nusecs) 
struct pollfd dummy; 
int timeout ; 


if ((timeout = nusecs / 1000) <= 0) 
timeout = 1; 
poll (&dummy, 0, timeout); 


} 


如 BSD usleep(3) 手 册页 中 所 说 明 的 ，usleep(3) 使 用 setitimer 设 置 间 隔 计 时 器 ， 
并 且 每 次 调用 它 时 ， 执 行 8 个 系统 调用 。 它 可 以 正确 地 和 调用 进程 设置 的 其 他 计时 器 交 王 ， 
而 且 即 使 捕捉 到 信号 也 不 会 被 中 断 。 
不 行 。 我 们 可 以 使 PELL_WRAIT 创 建 一 个 临时 文件 ， 其 中 一 个 字 节 用 作为 父 进程 的 锁 ， 另 
一 个 字 节 用 作为 子 进程 的 锁 。WAIT_cHILD 使 得 父 进程 等 待 获取 子 进程 字 节 上 的 锁 ， 
TELL_PARENT 使 得 子 进 程 释放 子 进程 字 节 上 的 锁 。 但 是 问题 在 于 ， 调 用 fork 导 致 释放 
所 有 子 进 程 中 的 锁 ， 使 得 子 进程 开始 运行 时 不 具有 任何 它 自 己 的 锁 。 
程序 清单 C-14 中 示 出 了 一 种 解决 方法 。 


程序 清单 C-14 用 非 阻 塞 写 计算 管道 的 容量 


#include "apue.h" 
#include <fcntl.h> 


int 
main (void) 
int i, n; 
int fd[2]; 
if (pipe(fd) < 0) 
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err sys ("pipe error"); 
set fl(fd[1], © _NONBLOCK) ; 


/* 
* Write 1 byte at a time until pipe is full. 
*/ 
for (n = 0; ; n++) { 
if ((i = write(fd[1], "a", 1)) != 1) { 
printf ("write ret %d, ", i); 
break; 


printf ("pipe capacity = %d\n", n); 
exit (0); 


} 
对 于 我 们 说 明 的 四 种 平台 上 ， 计 算出 的 值 示 于 下 面 的 表 中 。 


FreeBSD 5.2.1 
Linux 2.4.22 
Mac OS X 10.3 
Solaris 9 





这 些 值 可 能 与 对 应 的 PIPE_BUF 值 不 同 ， 其 原因 是 ，PIPE_BUF 被 定义 为 可 被 原子 地 写 
至 一 个 管道 的 最 大 数据 量 。 这 里 ， 我 们 计算 的 是 一 个 管道 独立 于 任何 原子 性 限制 可 保持 
的 数据 量 。 

程序 清单 14-12 中 的 程序 是 否 更 新 输入 文件 的 最 近 一 次 存 取 时 间 依 赖 于 操作 系统 以 及 文 
件 所 属 的 文件 系统 的 类 型 。 


第 15 章 


15.1 


15.2 


15.3 


15.4 


15.5 


如 果 写 管道 端 总 是 不 关闭 ， 则 读者 就 决 不 会 看 到 文件 的 结束 符 。 分 页 程序 就 会 一 直 阻 塞 
在 读 标 准 输入 。 
父 进程 向 管道 写 完 最 后 一 行 以 后 就 终止 ， 当 父 进程 终止 时 管道 的 读 端 自动 关闭 。 但 是 由 
于 子 进 程 (分 页 程序 ) 要 等 待 输出 的 页 ， 所 以 父 进程 可 能 比 子 进程 领先 一 个 管道 缓冲 区 。 
如 果 正 在 运行 一 个 可 对 命令 行进 行 编辑 的 交互 式 shell 上 ， 如 Korn shell, 当 父 进程 终止 时 
shell 多 半 会 改变 终端 的 模式 并 提示 用 户 。( 由 于 大 部 分 分 页 程序 在 等 待 处 理 下 一 个 页 面 
时 将 终端 设置 为 非 正规 模式 ， 所 以 这 无 疑 会 影响 分 页 程序 。) 
因为 执行 了 shell， 所 以 popen 函 数 返 回 一 个 文件 指针 。 但 是 shell 不 能 执行 不 存在 的 命令 ， 
因此 在 标准 错误 上 显示 下 面 信息 后 终止 ， 其 退出 状态 为 127，pclose 返 回访 命令 的 终止 
状态 ,这 如 同 从 waitpid 返 回 一 样 ; 

sh: line 1: ./a.out: No such file or directory 
当 父 进程 终止 时 ， 用 shell 看 它 的 终止 状态 。 对 于 Bourne shell, Bourne-again shellfüKorn 
shell， 所 用 的 命令 是 echo $?。 打 印 的 结果 是 128 加 信号 数 。 
首先 加 入 下 面 的 声明 ， 

FILE *fpin, *fpout; 


然后 用 faopen 关 联 管道 描述 符 和 标准 IO 流 ， 并 将 流 设置 为 行 缓冲 的 。 在 从 标准 输入 读 
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的 whiie 循 环 之 前 做 此 工作 。 
if ((fpin = fdopen(fd2[0], "r")) == NULL) 
err sys("fdopen error"); 
if ((fpout = fdopen(fdlí1], "w")) == NULL) 


err sys("fdopen error"); 

if (setvbuf(fpin, NULL, _IOLBF, 0) « 0) 
err sys("setvbuf error"); 

if (setvbuf(fpout, NULL, _IOLBF, 0) « 0) 
err sys("setvbuf error"); 


while 中 的 read 和 write 用 下 面 的 语句 代替 ， 


if (fputs(line, fpout) == EOF) 
err_sys("fputs error to pipe"); 

if (fgets(line, MAXLINE, fpin) == NULL) { 
err msg('"child closed pipe"); 
break; 


) 

15.6 system 国 数 调 用 了 wait， 终 止 的 第 一 个 子 进 程 是 由 popen 产 生 的 。 因 为 该 子 进程 不 是 
system 创 建 的 ， 所 以 它 将 再 次 调用 wait 并 一 直 阻 塞 到 sleep 完 成 。 然 后 system 返 回 。 
当 pclose 调 用 wait 时 ， 由 于 没有 子 进程 可 等 待 所 以 返回 出 错 ， 导 致 pcl1ose 也 返回 出 错 。 

15.7 select 表 明 描 述 符 是 可 读 的 , 调用 read 读 完 所 有 的 数据 后 返回 0 就 表明 到 达 了 文件 结尾 。 
但 是 对 于 poll (假设 管道 是 基于 STREAMS 的 ) 来 说 ， 若 返回 POLLHUP， 那 么 也 许 仍 有 
数据 可 以 读 。 但 是 一 旦 读 完 了 所 有 的 数据 read 就 返回 0， 即 表明 到 达 了 文件 结尾 。 在 读 
完了 所 有 的 数据 后 ， 即 使 需 安 再 调用 一 次 read 以 接收 文件 结尾 通知 也 不 返回 POLLIN。 
对 于 已 被 读者 关闭 的 引用 管道 的 输出 描述 符 来 说 ，select 表 明 读 描述 符 是 可 写 的 。 但 
当 调 用 write 时 产生 SIGPIPE 信 号 量 。 如 果 忽 略 该 信号 量 或 从 信号 量 处 理 程 序 中 返回 
时 ，write 就 返回 EBPIPE 错 误 。 而 对 于 po11， 如 果 管 道 是 基于 STREAMS 的 ，pol1 就 
对 该 描述 符 返 回 POLLHUP。 

15.8 子 进程 向 标准 出 错 写 的 内 容 同样 也 在 父 进程 的 标准 出 错 中 出 现 。 只 要 在 cmdstring 中 包含 
重 定向 2>&1， 就 可 以 将 标准 出 错 发 送 给 父 进 程 。 

15.9 popen 国 数 Efork 一 个 子 进程 ， 子 进程 通过 exec 执 行 Bourne shell。 然 后 shell 再 调用 
fork， 最 后 由 shell 的 子 进程 执行 命令 串 。 当 cmdstring 终 止 时 shell 恰 好 在 等 待 该 事件 ， 
然后 shel 退 出 ， 而 这 一 事件 又 是 pclose 中 的 waitpid 所 等 待 的 。 

15.10 解决 的 办 法 是 打开 FIFO 两 次 ， 一 次 读 一 次 写 。 我 们 绝 不 会 使 用 为 写 而 打开 的 描述 符 ， 但 
是 使 该 描述 符 打 开 就 可 在 客户 数 从 1 变 为 0 时 ， 阻 止 产 生 文件 终止 。 打 开 FIFO 两 次 需要 注 
意 下 列 操作 方式 〈 如 非 阻塞 open 所 要 求 的 ) ， 第 一 次 以 非 阻塞 、 只 读 方 式 cpen， 第 二 
次 以 阻塞 、 只 写 方式 cpen。( 如 果 先 用 非 阻塞 、 只 写 方式 open 将 返回 错误 。) 然后 关闭 
读 描述 符 的 非 阻塞 属性 。 代 码 参 见 程 序 清单 C-15。 


程序 清单 C-15 以 非 阻塞 方式 打开 FIFO 进 行 读 写 操作 


#include "apue.h" 
#include «fcntl.h» 


#define FIFO "temp. fifo" 
int 
main (void) 


int fdread, fdwrite; 
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unlink (FIFO) ; 

if (mkfifo(FIFO, FILE MODE) « 0) 
err sys("mkfifo error"); 

if ((fdread = open(FIFO, © RDONLY | O_NONBLOCK)) < 0) 
err sys("open error for reading"); 

if ((fdwrite = open(FIFO, O WRONLY)) « 0) 
err syS("open error for writing"); 

clr fl(fdread, O NONBLOCK) ; 

exit(0); 


) 


oo 





15.11 随意 读 取现 行 队列 中 的 消息 会 干扰 客户 一 服务 器 协议 ， 导 致 丢失 客户 请 求 或 者 服务 器 的 
响应 。 只 要 知道 队列 的 标识 符 或 者 该 队列 允许 所 有 的 用 户 读 ， 进 程 就 可 以 读 队 列 。 

15.13 由 于 服务 器 和 各 客户 进程 可 能 将 段 连 接 到 不 同 的 地 址 ， 所 以 在 共享 存储 段 中 决 不 会 存放 
实际 物理 地 址 。 相 反 ， 当 在 共享 存储 段 中 建立 链表 时 ， 指 针 的 值 设置 为 共享 存储 段 内 另 
一 对 象 的 偏 移 量 。 偏 移 量 为 所 指 对 象 的 实际 地 址 减 去 共享 存储 段 的 起 始 地 址 。 

15.14. 表 C-1 显 示 了 相关 的 事件 。 


表 C-1 程序 清单 15-12 中 父子 进程 间 的 交替 过 程 





由 mmap 初 始 化 
子 进程 先 运行 ， 然 后 阻塞 
父 进程 运行 


然后 父 进程 阻塞 
子 进程 恢复 


然后 子 进程 阻塞 
父 进程 恢复 


然后 父 进程 阻塞 


然后 子 进程 阻塞 
父 进程 恢复 





第 16 章 
16.1 程序 清单 C-16 显 示 了 一 个 打印 系统 字 节 序 的 程序 
、 程序 清单 C-16 判断 系统 宇 节 序 


#include <stdio.h> 
#include <stdlib.h> 
#include <inttypes.h> 
int 
main (void) 
uint32_t i; 
unsigned char *cp; 
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16.3 


16.6 





i = 0x04030201; 
cp = (unsigned char *)&i; 
if (*cp == 1) 

printf ("little-endian\n") ; 
else if (*cp == 4) 

printf ("big-endian\n") ; 
else 

printf ("who knows?\n") ; 
exit (0); 


} 


WT Sa, PEREN- T Qus HERE, POM METRE d_set pS 
一 条 记录 。 然 后 使 用 select 等 待 从 多 个 端点 来 的 连接 请 求 。 回 忆 16.4 节 ， 当 一 个 连接 
请 求 达 到 时 ， 一 个 端点 将 会 变 为 可 读 。 当 一 个 连接 请 求实 际 到 达 时 ， 接 受 该 请 求 ， 并 像 
以 前 那样 进行 处 理 。 

在 main 函 数 中 ， 通 过 调用 signal 函 数 (程序 清单 10-12) 来 捕获 SIGCHLD， 该 函数 使 
用 sigaction 来 安装 可 重 起 的 系统 调用 句柄 。 下 一 步 ， 从 serve 函 数 中 删除 waitpid 
调用 。 当 fork 完 子 进程 来 处 理 请 求 后 ， 父 进程 关闭 新 的 文件 描述 符 并 继续 监听 新 的 连接 
请 求 。 最 后 ， 需 要 一 个 处 理 STGCHLD 的 信号 处 理 程序 如 下 ; 

Kc signo) 


while (waitpid((pid t)-1, NULL, WNOHANG) > 0) 
} 


为 了 启用 异步 套 接 字 IO ， 需 要 使 用 F_SETOWN fcnt1 命 令 来 建立 套 接 字 的 所 有 权 
(ownership) ， 然 后 使 用 FIOASYNC ioct1 命 令 启 用 异步 信号 即 可 。 为 了 禁止 异步 套 接 字 
LILO， 只 要 简单 地 禁止 异 步 信 号 。 之 所 以 混合 使 用 fcnt1 和 ioct1 命 令 的 理由 是 想 找到 一 
个 可 移植 的 方法 来 处 理 异 步 套 接 字 。 代 码 见 程序 清单 C-17 中 。 


程序 清单 C-17 启用 与 禁止 异步 套 接 字 |/O 


#include "apue.h" 
#include <errno.h> 
#include <fcntl.h> 
#include «sys/socket.h» 
#include <sys/ioctl.h> 


#if defined(BSD) || defined(MACOS) || defined (SOLARIS) 
#include <sys/filio.h> 

#endif 

int 


setasync (int sockfd) 
int n; 


if (fcntl(sockfd, F SETOWN, getpid()) < 0) 
return(-1); 

n= 1; 

if (ioctl(sockfd, FIOASYNC, &n) < 0) 
return(-1); 

return(0); 
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int 
clrasync (int sockfd) 
int n; 


n= 0; 

if (ioctl (sockfd, FIOASYNC, &n) < 0) 
return(-1); 

return (0); 


} 


第 17 章 


17.3 声明 (declaration) 指定 了 标识 符 集合 的 属性 (如 数据 类 型 )， 如 果 声 明 也 造成 分 配 了 存 
储 单元 ， 那 么 这 就 是 定义 (definition), 
在 头 文件 opend.h 中 ， 用 extern 存 储 类 声明 了 三 个 全 局 变量 ， 这 时 并 没有 为 它们 
分 配 存储 单元 。 在 文件 main .c 中 定义 了 三 个 全 局 变量 ， 有 时 会 在 定义 时 就 初始 化 全 局 变 
量 ， 但 通常 使 用 C 的 默认 值 。 
17.5 select 和 pol1 作 为 函数 值 返 回 就 绪 的 描述 符 个 数 。 当 将 这 些 就 绪 找 述 符 都 处 理 完 后 ， 
操作 cl ient 数 组 的 循环 就 可 以 结束 。 


第 18 章 


18.1 注意 由 于 终端 是 非 规范 模式 ， 所 以 要 用 换行 符 而 不 是 回 车 符 终止 reset 命 令 。 

18.2 它 为 128 个 字符 建立 一 张 表 ， 根 据 用 户 的 要 求 设置 奇偶 校 验 位 。 然 后 使 用 8 位 VO 处 理 奇偶 
位 的 产生 。 

18.3 如 果 你 使 用 的 是 窗口 终端 ， 那 么 你 无 需 登 录 两 次 。 在 两 个 分 开 的 窗口 之 间 ， 你 可 以 做 这 
样 的 实验 。 在 Solaris， 运 行 stty -a， 并 且 将 标准 输入 重 定向 到 运行 vi 的 终端 ， 结 果 显 
示 vi 设 置 MIN 为 1、TIME 为 1。read 等 待 至 少 融 人 一 个 字符 ， 但 是 该 字符 输入 后 ， 只 对 
后 继 的 字符 等 待 十 分 之 一 秒 即 返 回 。 


$199 


19.1 telnetg 和 rlogind 两 个 服务 器 进程 均 以 超级 用 户 权限 运行 ， 所 以 它们 都 可 以 成 功 地 调 
用 chown 和 chmod,。 

193 执行 pty -n stty -a 以 避免 伪 终 端 从 设备 的 termios 结 构 和 winsize 结 构 初 始 化 。 

19.5 很 不 幸 ，fcnt1 的 F_SETEFL 命 令 不 允许 改变 读 写 状态 。 

19.6 有 三 个 进程 组 : (1) 登录 shell，(2) pty 父 进程 和 子 进程 ，(3) cat 进 程 。 前 两 个 进程 组 组 
成 了 一 个 会 话 ， 其 中 ， 登 录 shell 为 会 话 首 进 程 。 第 二 个 会 话 仅 包含 cat 进 程 。 第 一 个 进程 
组 (登录 shell) 是 后 台 进 程 组 ， 其 他 两 个 进程 组 是 前 台 进程 组 。 

19.7 当 从 其 行规 程 模块 接收 到 文件 终止 符 时 ， 首 先是 cat 终 止 。 它 造成 PTY 从 设备 终止 ， 这 又 
造成 PTY 主 设备 终止 。 接 着, 对 于 正 从 PTY 主 设备 读 取 的 pty 父 进程 产生 一 个 文件 终止 符 ， 
该 父 进程 将 SIGTERM 信 号 发 送 给 子 进程 ,于 是 子 进程 终止 ( 子 进程 不 捕捉 该 信号 )。 最 后 ， 
父 进 程 调 用 main 函 数 结尾 的 exit(0)。 
程序 清单 8-17 中 的 程序 的 相关 输出 为 ; 
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708 附录 C 部 分 习题 答案 一 


cat e = 270, chars = 274, stat = 0: 
pty e= 262, chars = 40, stat = 15: F X 
pty e= 288, chars = 188, stat = 0: 
这 可 通过 使 用 shell 的 echo 和 date(]) 命 令 实现 : 
#!/bin/sh 
( echo "Script started on " “date”; 
pty "S(SHELL:-/bin/sh]"; 
echo "Script done on " “date” ) | tee typescript 


PTY 从 设备 之 上 的 行规 程 能 够 回 送 ， 所 以 pty 从 其 标准 输入 所 读 取 的 以 及 写 向 PTY 主 设备 
的 按 默 认 都 回 送 。 尽 管 程序 (ttyname) 从 不 读 取 数据 但 是 该 回 送 也 可 通过 从 设备 之 
上 的 行规 程 模 块 实现 。 
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20.1 


20.2 


20.3 


20.5 


_db_dodelete 中 保守 的 加 锁 操 作 是 为 了 避免 和 dlb_nextrec 发 生 竞 争 条 件 。 如 果 没 有 
使 用 写 锁 保护 db_writedat 调 用 ， 则 有 可 能 在 _db_nextrec 读 某 个 记录 有 时， 该 记录 
已 被 删除 ， Glbb_nextrec 首 先 读 入 一 个 索引 记录 ， 判 定 该 记录 非 空 ， 接 着 读数 据 记 录 ， 
但 是 在 它 调用 _db_readidx 和 _db_readdat 之 闻 ， 该 记录 却 可 能 已 被 _db_dodelete 
删除 了 。 

假定 Qb_nextrec 调 用 _dab_readidx， 它 将 记录 的 关键 字 读 人 索引 缓冲 区 。 然 后 ， 该 进 
程 被 内 核 调 度 进 程 暂停 ， 另 一 个 进程 运行 ， 它 刚好 调用 ab_aelete 删 除了 这 一 条 记录 ， 
使 得 索引 文件 和 数据 记录 文件 中 对 应 部 分 都 被 清空 。 当 第 一 个 进程 恢复 执行 并 调用 
_db_readdat (在 ab_nextrec 国 数 体 中 ) 时 ， 返 回 的 是 空 数 据 记 录 。qb_nextrec 中 
的 读 锁 使 得 读 人 索引 记录 的 过 程 和 读 人 数据 记录 的 过 程 是 一 个 原子 操作 (对 于 其 他 操作 
同一 数据 库 的 合作 进程 而 言 )。 

强制 锁 对 其 他 的 读者 和 写 者 产生 了 影响 。 在 _dqb_writeidx 和 _qb_writedat 设 置 的 锁 
被 释放 之 前 ， 其 他 的 读 操作 和 写 操作 都 将 被 阻塞 。 

在 写 索 引 记 录 之 前 写 数 据 记 录 ， 依 靠 这 一 方法 来 防止 如 下 情形 : 若 该 进程 在 两 次 写 之 间 
被 杀 死 ， 就 会 产生 不 正常 的 记录 。 如 果 进 程 先 写 索引 记录 ， 而 在 写 数据 记录 之 前 被 杀 死 ， 
那么 就 会 得 到 一 个 有 效 的 索引 记录 ， 但 它 却 指 向 一 个 无 效 的 数据 记录 。 


第 21 章 


21.5 


这 里 有 一 些 提示 。 有 两 个 地 方 可 以 检查 队列 中 的 作业 ， 打印 守护 进程 的 队列 和 网 络 打印 
机 的 内 部 队列 。 注 意 ， 不 要 让 一 个 用 户 能 够 取消 另外 一 个 用 户 的 打印 作业 ， 当 然 ， 超 级 
用 户 可 以 取消 任何 作业 。 
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MO “definition of” 的 函数 子 项 指向 函数 原型 出 现 的 地 方 ， 当 该 函数 可 用 时 ， 指 向 函数 的 
源 代码 。 文 中 定义 的 用 于 后 续 例 子 中 的 函数 也 包 金 在 索引 中 ， 例 如 程序 清单 3-5 中 的 set_f1 函 
数 。 较 大 例子 〈 第 17、19、20 和 21 章 ) 中 的 某 些 部 分 是 外 部 函数 的 定义 ， 为 了 便于 理解 这 些 大 
例子 ， 这 些 外 部 函数 的 定义 也 包含 在 本 索引 中 。 另 外 ， 本 索引 还 包括 许多 例子 中 出 现 的 重要 函 
数 和 常量 ， 如 select 和 pol1。 不 过 几乎 每 个 例子 中 都 会 出 现 的 一 般 函 数 (如 exit) 出 现在 例 


子 中 时 并 没有 为 它们 建立 索引 。 


索引 中 的 页 码 为 英文 原 书页 码 ， 与 蔬 中 页 边 标注 的 页 码 一 致 。 


#1, interpreter files 

.， 见 current directory 

.., W parent directory 

.bash, login file (bash, login xt), 265 

.bash, profilefile (bash, profileX4t), 265 

.cshrc file (.cshrc xt), 265 

.loginfile (.1oginX(), 265 

.profilefile (.profileXfk), 265 

/bin/false program (/bin/falsef&)E), 163 

/bin/true program (/bin/truefHhF), 163 

/dev/fb device (/dev/fbiR&), 466 

/dev/fddevice (/dev/ fait), 84-85, 132, 656 

/dev/fd/0 device (/dev/fd/0i1k&), 85 

/dev/fd/1 device (/dev/£à/1Wtég), 85, 132 

/dev/td/2 device (/dev/f£d/21%&), 85 

/dev/klog device (/dev/klogWté&), 429 

/dev/kmem device (/dev/kmemitér), 65 

/dev/1og device (/dev/logWté&), 429, 439, 871 

/dev/null device (/dev/nullikt&), 69, 82, 279, 
466 

/dev/ptmx device (/dev/ptmxiz@), 683-685, 689- 
690 

/dev/pts device (/dev/ptsltég), 689 

/dev/pty device (/dev/ptylté), 686-687 

/dev/stderr device (/dev/stderrik@), 85, 658 

/dev/stdindevice (/dev/stdiniké$), 85, 658 

/dev/stdout device (/dev/stdoutik#), 85, 658 

/dev/tty device (/dev/ttyit&), 273, 279, 287, 
466, 654, 660, 705 

/dev/zero device (/dev/zeroMtég), 538-540 

/etc/gettydefs file (/etc/gettydefsX lk), 265 

/etc/group file (/etc/group Xf), 17-18, 161, 


169-170 

/etc/hosts file (/etc/hosts X4), 170 

/etc/inittabfile (/etc/inittab Xf), 265 

/etc/master.passwd file (/etc/master.Passwd X 
fF), 169 

/etc/motd device (/etc/motdik®), 466 

/etc/networks file (/etc/networks Xt), 170 

/etc/passwd file (/etc/passwaXft), 2, 92, 125, 
161-162, 164, 166, 169-170 

/etc/protocols file (/etc/protocols x), 170, 

/etc/pwd.db file (/etc/pwd. dbx), 169 

/etc/rcfile (/etc/rcXftk), 173, 266 

/etc/services file (/etc/services xX), 170 

/etc/shadow file (/etc/shadowX ft), 92, 169-170 

/etc/spwd.dbfile (/etc/spwd.dbx4tF), 169 

/etc/syslog.conf file (/etc/syslog.conf x‘), 
429 

/etc/termcap file (/etc/termcap tł), 672 

/ete/ttys file (/etc/ttysXft), 262 

/usr/lib/pt_chmod program (/usr/1lib/pt_ chmod 
EF), 685 

/var/account/acct file(/var/account/acct 44t), 
251 

/var/account/pacct file (/var/account/pacctX 
fF), 251 

/var/adm/pacct file (/var/adm/pacct xf), 251 

/var/log/wtmpfile (/var/log/wtmpXft), 171 

/var/run/utmpfile (/var/run/utmp X4), 171 

2.9BSD, 216 

386BSD, 34-35 

4.1BSD, 487 

4.BSD, 18, 112, 119-120, 167, 428-429, 474, 481, 
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483, 487, 545 

4.3BSD, 33-34, 36, 183, 240, 248, 265, 442, 497, 
699, 846, 888 

Reno, 34, 72 
Tahoe, 34, 888 

4.4BSD, 21, 34, 105, 112, 119, 139, 216, 462, 497, 
545, 699, 710, 888 

«aio.h» header (<aio.h> 头 文件 )，30 

<arpa/inet.h> header (<arpa/inet .h>& xX), 29, 
550 

<assert.h> header («assert.h»3k Xf), 27 

«bits/signum.h» header(«bits/signum.h»3k Xt), 
290 

«complex.h» header («complex.h»3k X4), 27 

<cpio.h> header («cpio.h»3k Xf), 30 

«ctype.h» header («ctype.h»3k Xf), 27 

«dirent.h» header («airent.h»3l X(E), 29, 121 

«dlfcn.h» header (<dlfcn.h> 头 文件 )，30 

<errno.h> header (<errno.h> 头 文件 )，14，16，27 

«fcntl.h» header (<fcntl.h> 头 文件 )，29, 60 

«fenv.h» header (<fenv.h> 头 文件 )，27 

«float.h» header (<float .h> 头 文件 )，27，38 

<fmtmsg.h> header (<fmtmsg.h> 头 文件 )，30 

<fnmatch.h> header (<fnmatch.h> 头 文件 )，29 

«ftw.h» header (<Etw.h> 头 文件 )，30 

<glob.h> header (<glob.h> 头 文件 )，29 

«grp.h» header (<grp.h> 头 文件 )，29，166，170 

<iconv.h> header («iconv.h»3k xf), 30 

<inttypes.h> header (<inttypes .h> 头 文件 )，27 

«iso646.h» header (<iso646.h> 头 文件 )，27 

«langinfo.h» header (<langinfo.h> 头 文件 )，30 

<libgen.h> header (<1ibgen.h> 头 文件 )，30 

«limits.h» header (<1imits.h> 头 文件 )，27，38-40， 
48-49 

«locale.h» header (<1ccale.h> 头 文件 )，27 

<machine/_types.h> header ( 
types.h»3k X (t), 854 

«math.h» header (<math.h> 头 文件 )，27 

<monetary.h> header (<monetary.h> 头 文件 )，30 

«mqueue.h» header (<mqueue .h> 头 文件 )，30 

«ndbm.h» header («ndbm.h-»3k Xf), 30 

<netdb.h> header («netdb.h»3k Xx fb), 29, 170 

«net/if.h»header («net/if.h»3k X4), 29 

«netdb.h» header («netdb.h»3kXfk), 29, 170 

<netinet/in.h> header (<netinet/in.h> 头 文件 )， 
29, 550-551 

<netinet/tcp.h> header(«netinet/tcp.h»3k Xf), 
29 

«nl, types.h» header («nl types.h»3kxft), 30 

«poll.h» header («poll.hs3k Xx), 30, 479 

<pthread.h> header («pthread.h»3k Xf), 30 

«pwd.h»header («pwd.h»3k X), 29, 161, 170 


<machine/_ 


<regex.h> header (<regex.h> 头 文件 )，29 

<sched.h> header (<sched.h> 头 文件 )，30 

«search.h» header (<search .h> 头 文件 )，30 

«semaphore.h» header (<semaphore .h> 头 文件 )，30 

<setjmp.h> header (<setjmp .h> 头 文件 )，27 

<shadow.h> header («shadow.h»3k X fE), 170 

«siginfo.h» header («siginfo.h»3k XE), 352 

«signal.h» header («signal.h»3k Xf), 27, 222, 
290, 299, 319-320, 353 

«spawn.h» header («spawn.h»3k 34k), 30 

<stdarg.h> header (<stdarg.h> 头 文件 )，27，151- 
152, 721, 724 

<stdbool .h> header («stdbool.h»3k Xf), 27 

<stddef.h> header («stddef.h»3k Xx fk), 27, 597 

<stdint.h> header («stdint.h»3k XE), 27, 551 

<stdio.h> header (<stdio.h>&Xt+), 10, 27, 38, 
50, 135, 137, 141, 153, 155-157, 654, 721, 843 

<stdlib.h> header («stdlib.h»3k Xft), 27, 190, 
843 

<string.h> header («string.hs3k Xf), 27, 843 

«strings.h» header («strings.h»3k Xd), 30 

«stropts.h» header («stropts.hs3k X fE), 30, 464, 
480, 482 

«sys/acct.h» header («sys/acct.h»3k X4t), 251 

<sys/conf.h> header («sys/con£.h»3l Xf), 466 

«sys/disklabel.h» header («sys/disklabel.h»3l 
Xt), 84 

«sys/filio.h» header («sys/filio.hs3k Xf), 84 

«sys/ipc.h» header («sys/ipc.h»3JkX(), 30, 520 

«sys/iso/signal, iso.h» header (<sys/iso/ 
signal iso.h»3k Xx fF), 290 

«sys/mkdev.h» header («sys/mkdev.h»3k Xf), 
128 

«Sys /mman.h» header («sys/mman.h»3k Xt), 29 

«sys/msg.h» header («sys/msg.h»3k X fF), 30 

«sys/mtio.h» header («sys/mtio.hs3k Xf), 84 

«sys/param.h» header («sys/param.h»3k Xf), 49- 
50 

<sys/resource.h> header («sys/resource.h»3k X 
f), 30 

«sys/select.h» header («sys/select.h»Sk Xf), 
29, 477, 874 

«<sys/select> header (<sys/select> 头 文件 ),，474 

«sys/sem.h» header («sys/sem.h»3l X fE), 30 

<sys/shm.h> header («sys/shm.h»3k X ff), 30 

«sys/signal.h» header (<sys/signal .hn> 头 文件 )， 
290 

«sys/socket.h» header («sys/socket.h»3E Xf), 
29, 563 

<sys/sockio.h> header (<sys/sockio.h> 头 文件 )， 
84 
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«sys/stat.h» header («sys/stat.h»3k XE), 29, 
91 

«sys/statvfs.h» header(«sys/statvfs.h»3Xk Xt), 
30 

«sys/sysmacros.h» header (<sys/sysmacros.h>% 
MHF), 128 

<sys/time.h> header («sys/time.hs3k Xt), 30, 
474 

«sys/timeb.h» header («sys/timeb.hs3k Xt), 30 

«sys/times.h» header («sys/times.h»3Ll Xf), 29 

«sys/ttycom.h» header («sys/ttycom.h»3k X (t), 
84 

<sys/types.h> header («sys/types.h»3k Xf), 29, 
56, 128, 474, 518 

«sys/uio.h»header («sys/uio.h»s3k Xf), 30 

«sys/un.h» header («sys/un.h»3k X fF), 29, 595 

«sys/utsname.h» header(«sys/utsname.h»3k X fF), 
29 

«sys/wait.h» header («sys/wait.hs3k X4), 29, 
221 

«syslog.h» header («syslog.h»3l Xf), 30 

«tar.h» header («tar.h»3k X fF), 29 

<termio.h> header («termio.h»3L X fk), 634 

<termios.h> header («termios.h»3k X (b), 29, 84, 
634 

«tgmath.h» header («tgmath.h»3L Xf), 27 

«time.h» header (<time .h> 头 文件 )，27，57 

«trace.h» header (<trace.h> 头 文件 )，30 

«ucontext.h» header (<ucontext .h> 头 文件 )，30 

«ulimit.h» header (<ulimit.h> 头 文件 )，30 

<unistd.h> header (<unistda.h> 头 文件 )，9，29，52， 
60，69，103，401，474，721，843 

«utime.h» header (<utime .h> 头 文件 )，29 

<utmpx.h> header («utmpx.h»3k xf), 30 

«varargs.h» header («varargs.h»3& Xf), 151 

«wchar.h» header («wchar.h»3kh Xf), 27, 134 

«wctype.h» header («wctype.h»3k Xf), 27 

<wordexp.h> header («wordexp.h»3k Xt), 29 

—STDC, constant (_STDC_ 常量 )，56 

_db_alloc function (_db_alloc¥t), 723, 726-727 

_db_dodelete function (_db_dodeletepyS), 734- 
735, 738, 742, 746-747, 752, 883 

.db find and, lock function ( db find and lock 
ER), 728-729, 733-734, 740-741, 743, 752 

_db_findfree function (. db. findfreepgNk), 741, 
743-744, 747 

.db free function (_db_freepi#t), 724, 727 

.db hash function (_db_hashpi%), 730, 752 

_db_readdat function (_db_readdat HBr), 728, 734, 
883 

_db_readidx function (. db. readidxtK i), 730-731, 
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746, 883 

. db readptr function ( db, readptriRg AK), 729, 731, 
752 

_db_writedat function (_db_writedat me), 735, 
737-738, 741-742, 747, 752, 883 

_db_writeidx function (_db_writeidx me), 484, 
725, 738, 741-742, 747, 752, 883 

. db writeptr function (_db_writeptr MX), 725, 
739, 741-742 

_exit function (. exitjg E), 180, 183, 217-221, 247, 
259-260, 306, 340, 342, 345, 354, 360, 407, 
864, 867 

. Exit function (_Exitpm&c), 180, 183, 218-219, 221, 
306, 340, 342, 360, 407 

definition of (_Exit ABE X.), 180 

_exit function definition of (. exiti& ZR SZ), 180 

.FILE OFFSET BITS constan ( FILE OFFSET BITS 
WH), 67 

.GNU SOURCE constant ( GNU SOURCES), 91 

.IO, LINE BUFFERED constant ( TO LINE | BUFFERED 
常量 )，154 

_IO_UNBUFFERED constant (_IO_UNBUFFERED 常 量 )， 
154 

_IOFBF constant (_IOFBF 常 量 )，137 

_IOLBF constant (_IOLBF 常 量 )，137，202 

_IONBF constant (_IONBF 常 量 )，137 

_longjmp function (_longimpi%), 330, 333 

_NFILE constant ( NFILETÉ Æ), 50 

_PC_ASYNC_IO constant (. PC. ASYNC, IO Œ), 54 

.PC, CHOWN, RESTRICTED constant (_PC_CHOWN_ 
RESTRICTED# Œ), 54 

.PC FILESIZEBITS constant ( PC, FILESIZEBITSTÉ 
E), 43 

—PC, LINK MAX constant ( PC | LINK MAX Œ), 43 

—PC MAX CANON constant ( PC, MAX CANON ER), 43, 
46 

_PC_MAX_INPUT constant ( PC, MAX INPUT' Ei), 43 

_PC_NAME_MAX constant ( PC NAME MAX #4), 43 

.PC NO TRUNC constant ( PC NO TRUNC?$EE), 54-55 

.PC. PATH MAX constant (_PC_PATH_MAX# 4), 43, 50 

.PC PIPE BUF constant (_PC_PIPE_BUF#H), 43 

. PC, PRIO IO constant (_PC_PRIO_IO# 4), 54 

_PC_SYMLINK_MAX constant ( PC SYMLINK MAX'É ER), 
43 

.PC. SYNC IO constant ( PC SYNC IO), 54 

_PC_VDISABLE constant ( PC VDISABLES E), 54, 
639 

.POSIX2, LINE MAX constant ( POSIX2, LINE MAX'É 
5), 41 

.POSIX ARG MAX constant ( POSIX ARG MAX), 
39 
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_POSIX_ASYNC_IO constant (_POSIX_ASYNC_Io#), 
54 

_POSIX_C_SOURCE constant (_ POSIX_C_SOURCE# &), 
55, 81 

_POSIX_CHILD_MAX constant (_POSIX_CHILD_MAX# 
Ht), 39 

.POSIX CHOWN RESTRICTED constant ( POSIX. 
CHOWN_RESTRICTED##), 54-55, 103 

.POSIX HOST NAME MAX constant ( 
HOST NAME MAX 7A E), 39 

.POSIX, JOB, CONTROL constant (. POSIX, JOB. 
CONTROLS E), 53, 55 

.POSIX LINK MAX constant ( POSIX LINK MAXT E), 
39 

.POSIX LOGIN. NAME, MAX constant ( POSIX LOGIN 
NAME MAX i), 39 

.POSIX MAX CANON constant ( POSIX MAX CANONTÉ 
E), 39 

.POSIX MAX INPUT constant ( POSIX MAX INPUT 
E), 39 

.POSIX NAME MAX constant ( POSIX NAME MAX E), 
39 

.POSIX NGROUPS, MAX constant ( POSIX NGROUPS 
MAX 常 量 )，39 

_POSIX_NO_TRUNC constant (_POSIX_NO_TRUNC 常 量 )， 
54-55, 62 

.POSIX OPEN MAX constant ( POSIX OPEN MAXTÉE), 
39-40 

.POSIX PATH MAX constant ( POSIX PATH MAX'T E), 
39-40, 656-657 

.POSIX PIPE BUF constant ( POSIX PIPE BUFT RR), 
39 

.POSIX PRIO IO constant ( POSIX PRIO IO« Œ), 
54 

.POSIX RE DUP. MAX constant ( POSIX RE | DUP. MAX 
常量 ) 39 

_POSIX_READER_WRITER_LOCKS constant (_POSIX_ 
READER WRITER LOCKS E), 53 

.POSIX, SAVED, IDS constant (. POSIX SAVED IDSjTÉ 
E), 53, 55, 92, 238, 312 

.POSIX SHELL constant ( POSIX SHELLTE E), 53 

.POSIX SOURCE constant (_POSIX_SOURCE# E), 55 

.POSIX SSIZE MAX constant ( POSIX SSIZE MAXTÉ 
E), 39 

.POSIX STREAM MAX constant ( POSIX STREAM MAX 
常量 ) 39 

.POSIX SYMLINK MAX constant (_POSIX_SYMLINK_ 
MAX# E), 39 

_POSIX_SYMLOOP_MAX constant ( POSIX SYMLOOP 
MAX), 39 

.POSIX SYNC, IO constant ( POSIX, SYNC, IOTÉ E), 


.POSIX. 


54 

—POSIX, THREAD ATTR STACKADDR constant (| POSIX. 
THREAD_ATTR_STACKADDR# 4), 391 

_POSIX_THREAD_ATTR_STACKSIZE constant (_POSIX_ 
THREAD_ATTR_STACKSIZE#), 391 

_POSIX_THREAD_PROCESS_SHARED constant ( POSIX. 
THREAD_PROCESS_SHARED#&), 394 

_POSIX_THREAD_SAFE_FUNCTIONS constant (_POSIX_ 
THREAD_SAFE_FUNCTIONS# $Æ), 401 

.POSIX THREADS constant (_POSIX_THREADS # #8), 
54-55, 356 

.POSIX,TTY NAME, MAX constant ( POSIX TTY 
NAME MAX EE), 39 

..POSIX, TZNAME MAX constant ( POSIX TZNAME MAX 
常量 ) 39 

_POSIX_V6_ILP32_OFF32 constant (_POSIX_V6_ 
ILP32 OFF327$EE), 67 

.POSIX, V6, ILP32. OFFBIG constant (. POSIX V6. 
ILP32 OFFBIGT E), 67 

.POSIX V6 LP64 OFF64 constant ( POSIX V6. 
LP64_OFF64 常 量 )，67 

_POSIX_V6_LP64_OFFBIG constant (_POSIX_V6_ 
LP64 OFFBIGT E), 67 

.POSIX VDISABLE constant ( POSIX VDISABLETH É), 
54-55, 638-639 

.POSIX, VERSION constant (. POSIX VERSION $), 

/.53, 55, 172 
_SC_ARG_MAX constant ( SC ARG MAXTÉ EE), 42, 46 
..SC, ATEXIT, MAX constant (. SC, ATEXIT MAX EX&), 


42 

.SC, CHILD MAX constant (_SC_CHILD_MAX# 4), 42, 
203 

.SC CLK, TCK constant (_SC_CLK_TCK##), 42, 257- 
258 


_SC_COLL_WEIGHTS_MAX constant (. SC, COLL. 
WEIGHTS_MAX#&), 42 

_SC_IOV_MAX constant (_SC_IOV_MAK#4E), 42 

—SC,JOB CONTROL constant (. SC. JOB. CONTROL'IE K ) , 
53-54 

.SC. LINE, MAX constant (. SC. LINE, MAX K), 42 

.SC. LOGIN, NAME MAX constant ( | SC, LOGIN. - 
NAME, MAX E), 42 

—SC, NGROUPS, MAX constant (. SC. NGROUPS MAX KK), 


42 

..SC OPEN MAX constant ( SC. OPEN MAX S), 42, 51, 
203, 855 

.SC. PAGE SIZE constant ( SC PAGE, SIZE), 42, 
489 

_SC_PAGESIZE constant (_SC_PAGESIZE##), 42, 
489 


.SC RE DUP MAX constant ( SC RE DUP MAXT"ÜE), 
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42 

_SC_READER_WRITER_LOCKS constant ( . SC 
READER WRITER LOCKS E), 53 

—SC,. SAVED, IDS constant ( SC, SAVED IDSTÉ EE), 53- 
54, 92, 238 

.SC, SHELL constant (. SC . SHELL Æ), 53 

—SC, STREAM, MAX constant (. SC, STREAM, MAXTE E), 
42 

—SC. SYMLOOP. MAX constant (. SC, SYMLOOP. MAX AE REO), 
42 

—SC, THREAD, ATTR, STACKADDR constant (_SC_ 
THREAD ATTR, STACKADDRAE E), 391 

. SC. THREAD, ATTR, STACKSIZE constant (_SC_ 
THREAD ATTR STACKSIZETM SR), 391 

—SC, THREAD, DESTRUCTOR, ITERATIONS constant 
(_SC_THREAD_DESTRUCTOR_ITERATIONS# E), 
388 

—SC, THREAD, KEYS MAX constant (, SC, THREAD 
KEYS MAX RE), 388 

.SC, THREAD, PROCESS, SHARED constant (_SC_ 

THREAD PROCESS, SHARED7A €), 394 

.SC, THREAD, SAFE, FUNCTIONS constant (_SC_ 

THREAD SAFE FUNCTIONS A &), 401 

.SC, THREAD STACK MIN constant (. SC. THREAD, 

TACK MINE), 388 

—SC, THREAD THREADS, MAX constant ( SC, THREAD - 

THREADS MAXT6 Æ), 388 

—SC, THREADS constant (. SC, THREADS TÉ RE), 356 

—SC, TTY NAME, MAX constant ( SC TTY NAME MAX'É 
Æ), 42 

—SC,. TZNAME MAX constant (_SC_TZNAME_MAX# Œ), 
42 

—SC, V6, ILP32 OFF32 constant (. SC, V6, ILP32.. 
OFF32 常 量 ) 67 

_SC_V6_ILP32_OFFBIG constant (_SC_V6_ ILP32_ 
OFFBIG 常 量 ) 67 

_SC_V6_LP64_OFF64 constant (_SC_V6_LP64_ OFF64 
常量 ) 67 

_SC_V6_LP64_OFFBIG constant (_SC_V6_LP64_ 
OFFBIG 常 量 ) 67 

_SC_VERSION constant ( SC VERSIONTE EE), 49, 53 

—SC. XOPEN CRYPT constant ( SC XOPEN. CRYPTAÉE &), 
53 

— SC, XOPEN, LEGACY constant (_SC_XOPEN_LEGACY# 
E), 53 

_SC_XOPEN_REALTIME constant ( _SC_XOPEN_ 
REALTIMETÉ E), 53 

..SC, XOPEN, REALTIME, THREADS constant (_SC_ 
XOPEN REALTIME THREADS 4i), 53 

—SC, XOPEN. VERSION constant (_SC_XOPEN_ VERSION 
AE), 53-54 
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_setjmp function ( setjmprg 4k), 330, 333 

_XOPEN_CRYPT constant (_KOPEN_CRYPT##), 32, 53 

. XOPEN, IOV, MAX constant (, XOPEN, IOV, MAX EE), 
4] 

.XOPEN LEGACY constant ( XOPEN LEGACYA €), 32, 
53 

—XOPEN| NAME MAX constant ( XOPEN NAME MAXA RE), 
41 

_XOPEN_PATH_MAX constant (_XOPEN_PATH_MAX# Æ), 
41 

_XOPEN_REALTIME constant (_XOPEN_REALTIME# E), 
32, 53 

_XOPEN_REALTIME_THREADS constant (_XOPEN_ 
REALTIME_THREADS#&), 32, 53 

_XOPEN_SOURCE constant (_XOPEN_SOURCE##), 55 

_XOPEN_STREAMS constant (_XOPEN_STREAMS #4), 
32 

_XOPEN_UNIX constant (_XOPEN_UNIX# 4), 29, 55 

_XOPEN_VERSION constant (_KOPEN_VERSION# Æ), 
53, 55 


A 


a2ps program (a2psfgH-), 805 
abort function (abort ma), 180, 218, 223, 253, 
256, 289, 293-295, 340-342, 353, 407, 848, 870 
definition of, (abort ABUSE X.), 340-341 
absolute pathname (绝对 路 径 名 ) 5, 7, 43, 49, 126, 
131, 242, 859 
accept function (accept MH), 138, 306, 411, 563- 
564, 570, 572, 597, 599-600, 780 
definition of (accept 国 数 的 定义 ) 563 
access function (access 国 数 )，95-97，113，116，306 
definition of (access 国 数 的 定义 )，95 
accounting (记载 ， 会 计 ) 
login (登录 )，170-171 
process (H£), 250-256 
acct function (acctig f), 250 
acct structure (acct£& Ej), 251, 254 
acctcom program (acctcom 程 序 )，250 
accton program (accton 程 序 )，250-251，255 
ACOMPAT constant (ACOMPAT 常 量 ) 251 
ACORE constant (ACORE 常 量 )，251，254-255 
acstime_r function (acstime_r 图 数 )，402 
add, job function (adà jobERK, 783, 790 
add option function (add_option¥t), 794, 797 
add worker function (add, workertREr), 787, 791 
addressing, socket ( 套 接 字 寻 址 )，549-561 
addrinfo structure (addrinfo 结 构 )，555-559，569， 
571, 573, 576, 578, 779, 782, 796 
adjustment on exit, semaphore (exit 时 的 信号 量 调整 ) ， 
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532-533 

Adobe Sy. ems (Adobe 系 统 )，885 

advisory record locking (建议 性 记录 锁 )，455 

AES (Application Environment Specification), 32 

AEXPND constant (AEXPND#&), 251 

AF_INET constant (AF_INET##), 547, 551-552, 554, 
557, 559-560 

AF INET6 constant (AF INET6 4T), 551-552, 557 

AF IPXconstant (AF IPXT4 E), 546 

AF LOCAL constant (AF_LOCAL## Œ), 546 

AF UNIX constant (AF UNIX EK), 546, 557, 595-598, 
600-601 

AF UNSPEC constant (AF_UNSPEC 常 量 ) 546, 557 

AFORK constant (AFORK AE Œ), 251-252, 254 

agetty program (agetty 程 序 ) 265 

Aho, A.V., 243, 885 

AI_ALL constant (AI_ALL 常 量 )，559 

AI_CANONNAME constant (AI_CANONNAME# #), 559, 
571, 574, 578 

AI NUMERICHOST constant (AIT_NUMERICHOST# Æ), 
559 

AI. NUMERICSERV constant (AI_NUMERICSERV# Œ), 
559 

AI PASSIVE constant (AI PASSIVEAM d), 559 

AI_V4MAPPED constant (AI_V4MAPPED# Œ), 556, 559 

aio error function (aio_error RX), 306 

aio return function (aio_return%t), 306 

aio, suspend function (aio suspendpÉ 2E), 306, 411 

AIX, 36 

alarm function (alarm), 289, 293, 306-307, 310, 
313-318, 331, 348-349, 354, 575-576, 867 

definition of (alarm 国 数 的 定义 ) 313 
alloca function (alloca 国 数 )，192 
already. running function (already_running Hx) 
definition of (already runningBR KE X), 433 

ALTWERASE constant (ALTWERASETÉ i), 636, 642, 645 

American National Standards Institute, Ul, ANSI 

Andrade, J. M., 521, 885 

ANSI (American National Standards Institute) (美国 国家 标 
准 学 会 )，25 

Application Environment Specification， 见 AES 

apue.h header (apue .h 头 文件 )，6，9-10，229，299， 
449-450，597，721，843- 846 

apue_db.h header (apue_dqb .h 头 文件 )，711，719， 
723，727 

Architecture, UNIX (UNIX 体 系 结构 )，1-2 

ARG_MAX constant (ARG, MAX7S Œ), 39, 42, 46, 48, 
233, 404 

argc variable (argc BH), 778 

arguments, command-line (命令 行 参 数 ) 185 

argv variable (argv), 774 


Arnold J. Q., 188, 885 
asctime function (asctime%t), 175, 402 
definition of (asctime 国 数 的 定义 ) ，175 

ASU constant (ASU 常 量 ) 251, 254 

asynchronous I/O (异步 JO)，473，481-482 

asynchronous socket I/O (异步 套 接 字 IO ) 582-583 

at program (at 程序 )，431 

AT&T, 5, 33-34, 159, 311, 460, 462, 479, 885-886 

atexit function (atexit MR), 42, 182, 184, 207, 
218, 365, 696, 863 | 

definition of (atexit 函 数 的 定义 )，182 

ATEXIT_MAX constant (ATEXIT_MAX 常 量 )，40，42，48， 
51 

atol function (atol MB), 781 

atomic operation (AF84), 39, 43, 57, 61, 74-75, 
77, 109, 139, 333, 340, 448, 515, 528, 530, 
532, 883 

automatic variables (A apa), 187, 197, 199, 201, 
207 

avoidance, deadlock (避免 死 锁 ) 373 

awk program (awk 程序 )，44-46，243-246，514，887 

AXSIG constant (AXSIGH MH), 251, 254-255 


B 


BO constant (BO# E), 652 

B110 constant (B110#$&), 652 

B115200 constant (B115200 常 量 )，652 

B1200 constant (B1200 常 量 ) 652 

B134 constant (B134 常 量 )，652 

B150 constant (B150 常 量 )，652 

B1800 constant (B1800 常 量 )，652 

B19200 constant (B19200 常 量 )，652 

B200 constant (B200 常 量 )，652 

B2400 constant (B2400 常 量 )，652 

B300 constant (B300 常 量 )，652 

B38400 constant (B38400 常 量 )，652 

B4800 constant (B4800 常 量 )，652 

B50 constant (B50 常量 )，652 

B57600 constant (B57600 常 量 )，652 

B600 constant (B600 常 量 )，652 

B75 constant (B75 常量 )，652 

B9600 constant (B9600 常 量 )，652 

Bach, M.J, 70, 77, 104, 108, 211, 461, 855, 886 

background process group (后 台 进 程 组 )，272，275，277， 
279, 281-282, 284-285, 296-297, 344, 349, 882 

backoff, exponential (指数 补偿 ) 562 

Barkley, R. E., 886 

basename function (basenametg Ai), 402 

bash program (bashf#F*), 81, 158, 250 

Bass, J., 445 

baud rate, terminal VO (终端 IO 波 特 率 ) 652-653 
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Berkeley Software Distribution， 见 BSD 
bibliography, alphabetical (字母 序 参考 文献 ) 885-890 
big-endian byte order, 549 (大 端 字 节 序 ) 
bind function (bind), 306, 560, 564, 580-581, 
596-598, 600-601 
definition of (bina 函 数 的 定义 )，560 
block special file ( 块 特殊 文件 )，89，128-129 
Bolsky, M.I., 510, 886 
Bostic, K., 33, 70, 104, 108, 461, 487, 888 
Keith, 211, 218 
Bourne shell, 3, 52, 86, 158, 192, 204, 265, 275, 
278, 346, 457, 504, 510, 662, 877, 887 
Bourne, S.R., 3 
Bourne-again shell, 3, 51-52, 81, 86, 192, 204, 265, 
275, 510 
BREAK character (BREAK), 637, 642, 645, 648, 
650, 654, 668 
BRKINT constant (BRKINT/ E), 635, 645, 648, 666- 
668 
BSO constant (BS0 $8), 645 
BS1 constant (BS1 常 量 ) 645 
BSD (Berkeley Software Distribution), 34, 62, 83, 262, 
265-266, 268-269, 271, 273-274, 442, 473, 481- 
482, 493, 552-553, 595, 683, 685-686, 689, 691, 
699, 706-707 
BSD Networking Release 1.0, 34 
BSD Networking Release 2.0, 34 
BSDLY constant (BSDLYTÉ E), 637, 644-645, 649 
bss segment (bss), 187 
buf, args function (buf_argsP&), 618-620, 628-629, 
845 
definition of (buf. args 图 数 的 定义 ) ，619 
buffer cache (缓冲 区 高 速 缓存 ) 77 
buffering, standard VO (RENO), 135-137, 213, 
217, 247, 342, 513-514, 680, 718 
BUFSIZ constant (BUFSIZ E $Æ), 49, 137, 202 
build, qonstart function (build qgonstartHR A), 
780, 785 
BUS, ADRALN constant (BUS_ADRALN#&), 327 
BUS, ADRERR constant (BUS_ADRERR# iK), 327 
BUS, OBJERR constant (BUS, OBJERRTS RE), 327 
byte order (2675 FF) 
big-endian (大 端 字 节 序 ) 549 
little-endian (小 端 字 节 序 )，549 
byte ordering ( 字 节 排序 )，549-550 


C 


C, ANSI 
ISO, 25-26, 887 
C shell, 3, 52, 204, 265, 275, 510 


c99 program (c99fgJ), 56, 67 
cache 
buffer (缓冲 区 高 速 缓存 ) 77 
page (页 面 高 速 缓存 ) ，77 
caddr_t datatype (caddr_t Broek #!), 57 
CAE (Common Application Environment), 32 
calendar time (日 历时 间 )，20，24, 57, 117, 173-175, 
246, 251-252 
calloc function (callocpBt), 189-190, 207, 467, 
506, 726, 863 
definition of (calloc 力 数 的 定义 ) 189 
cancellation point (取消 点 )，410-411 
canonical mode, terminal IO (终端 IO 规范 模式 ) 660-663 
Carges, M.T., 521, 885 
cat program (cat 程 序 ) 85, 104, 114, 276, 279, 699, 
714, 882 
catclose function (catclose%), 412 
catgets function (catgetspi%), 402, 412 
catopen function (catopen 图 数 )，412 
CBAUDEXT constant (CBAUDEXT 常 量 ) 635, 645 
cbreak terminal mode (cbreak 终 止 模式 )，632，664，668， 
673 
cc program (cc 程序 )，6，55，189 
cc(1)program (cc(]) 程 序 ) 6 
cc, t datatype (cc_t 数 据 类 型 )，634 
CCAR_OFLOW constant (CCAR_OFLOW 常 量 )，635，645， 
649 
CCTS_OFLOW constant (CCTS_OFLOW 常 量 )，635，645 
cd program (cd 程序 )，126 
CDSR, OFLOW constant (CDSR_OFLOW# #), 635, 645 
CDTR IFLOW constant (CDTR_IFLOW#H#), 635, 645 
cfgetispeed function (cfgetispeedmR), 306, 637, 
652 
definition of (cfgetispeed RMX), 652 
cfgetospeed function (cfgetospeed HX), 306, 637, 
652 z 
definition of (cfgetospeed MMH), 652 
cfsetispeed function (cfsetispeed aX), 306, 637, 
652 
definition of (cfsetispeeda 国 数 的 定义 ) 652 
cfsetospeed function (c£setospeedtgi), 306, 637, 
652 
definition of (cfsetospeed HE X.), 652 
CHAR, BIT constant (CHAR, BITTE E), 38 
CHAR, MAX constant (CHAR, MAX TE Œ), 38 
CHAR, MIN constant (CHAR. MIN TÉ S), 38 
character special file (字符 特殊 文件 ) 89, 
466, 659 
CHARCLASS, NAME, MAX constant (CHARCLASS NAME. 
MAX# E), 39, 48 
chdir function (chair), 7, 113, 125-127, 131, 


128-129, 461, 
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204, 264, 306, 427, 860 
definition of (chair 国 数 的 定义 ) ，125 
Chen，D.，886 
CHILD, MAX constant (CHILD_MAX 常 量 )，39，42，48， 
215 
chmod function (chmod i$), 99-101, 113, 117, 306, 
520, 600-601, 687, 689-690, 882 
definition of (chmod HEMI), 99 
chmod program (chmod#F*), 93, 521 
chown function (chowntR E), 54, 102-103, 112-113, 
117, 264, 306, 520, 687, 689, 882 
definition of (chown kÆ), 102 
chroot function (chroot), 131, 439, 858, 871 
CIBAUDEXT constant (CIBAUDEXT EK), 635, 645 
CIGNORE constant (CIGNORE4É &), 635, 645 
CLD CONTINUED constant (CLD_CONTINUED 常 量 ) 327 
CLD_DUMPED constant (CLD_DUMPED#{4), 327 
CLD EXITED constant (CLD_EXITED#&), 327 
CLD_KILLED constant (CLD_KILLED# Œ), 327 
CLD_STOPPED constant (CLD_STOPPED*#&), 327 
CLD_TRAPPED constant (CLD_TRAPPED##), 327 
clearenv function (clearenv 国 数 ) 194 
clearerr function (clearerrp%t), 141 
definition of (clearerr 国 数 的 定义 ) 141 
Cli args function (cli_args fH), 618-620, 628 
definition of (clii_args 函 数 的 定义 )，620 
cli conn function (cl1i_conn 国 数 ) 592-593, 600, 
621, 626, 845 
definition of (cli  connERÉBUsE X.), 592, 594, 600 
client-server 
model (客户 进程 -服务 器 进程 模型 )，439，541-543 
client, add function (client_add 图 数 )，623，625- 
627 
definition of (client_aqd 国 数 的 定义 )，623 
client_alloc function (client_alloc 国 数 )，623 
definition of (client_alloc 国 数 的 定义 ) 622 
client cleanup function (client_cleanup 国 数 )， 
787，792 
client_del function (client_qde1 函 数 )，625，627 
definition of (client_del 函 数 的 定义 )，623 
client thread function (client_thread 函 数 )，787 
CLOCAL constant (CLOCAL 常 量 )，294，635，645 
clock function (clock 国 数 )，57 
clock tick (时 钟 滴 答 )，20，42，48，57， 251-252, 257 
clock_gettime function (clock_gettime#r), 306 
clock_nanosleep function (clock_nanosleepp Sr), 
411 
Clock t datatype (clock_t 数 据 类 型 ) 20, 57, 257 
CLOCKS_PER_SEC constant (CLOCKS_PER_SEC 常 量 )， 
57 
clone device, STREAMS (STREAMS 克隆 设备 ) 683 


clone function (clone), 211, 360, 416 
close function (closed SE), 8, 51, 59, 63, 77, 115, 
118, 306, 411, 427, 433, 452, 461, 493, 499- 
501, 506, 511-512, 515, 521-522, 539-540, 543, 
547-548, 564, 571, 573, 581, 587-588, 592-504, 
598-599, 601, 616-617, 619, 625, 627-628, 684- 
685, 688, 690, 693, 704-705 
definition of (close 国 数 的 定义 )，63 
close-on-exec flag (执行 时 关闭 标志 )，76，79，234，452 
closedir function (closedqir 国 数 )，5$，7，120-125， 
412，658，858 
definition of (closeGir 国 数 的 定义 )，120 
closelog function (closelog 国 数 )，412，430 
definition of (closelog Rhy SZ), 430 


clr_fl function (clr_flp%), 81, 442-443, 844, 
879 

clrasync function, definition of (clrasync 国 数 的 定义 )， 
881 


clri program (clri 程 序 )，114 
CMSG, DATA function (CMSG_DATA 函 数 )，607-608，610， 
612, 614 
definition of (CMSG_DATA 函 数 的 定义 )，607 
CMSG FIRSTHDR function (CMSG_FIRSTHDR 函 数 )，607， 
614 
definition of (CMSG_FIRSTHDR 函 数 的 定义 )，607 
CMSG_LEN function (CMSG_LEN 函 数 )，607-609，611， 
613 
definition of (CMSG_LEN 函 数 的 定义 )，607 
CMSG_NXTHDR function (CMSG_NXTHDR 函 数 )，607， 
612, 614 
definition of (CMSG_NXTHDR 国 数 的 定义 ) ，607 
cmsgcred structure (cmsgcred 结 构 )，610-613 
cmsghár structure (cmsghar 结 构 )，607-609，611，613 
CMSPAR constant (CMSPAR 常 量 )，637，645，650 
codes，option (选项 代码 )，31 
COLL_WEIGHTS_MAX constant (COLL, WEIGHTS, MAX É 
Æ), 39, 42, 48 
COLUMNS environment variable (COLUMNS 环 境 变量 ) 193 
Comer, D.E., 710, 886 
command-line arguments (命令 行 参数 ) 185 
Common Application Environment， 见 CAE 
Common Open Software Environment， 见 COSE 
communication, network printer (网 络 打印 机 通信 )，753- 
805 
comp t datatype (comp t 数据 类 型 )，57 
Computing Science Research Group， 见 CSRG 
cond signal function (cond_signal AX), 385 
connect function (connect A), 306, 411, 561-563, 
565-566, 577, 597, 601 
definition of (connect AAI), 561 
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connect, retry function (connect_retry aX), 569, 
763, 797 
definition of (connect, retrytR ABE X.), 562 
connection establishment (连接 建立 ) 561-565 
connld STREAMS module (connlà STREAMS 模 块 )， 
518, 590, 592, 600 
controlling 
process (控制 进程 )，272，294 
terminal (控制 终端 )，61，215，234,，251，268，271- 
274, 276, 278-279, 281, 284, 286-287, 294, 
296-297, 349, 423-425, 428, 439, 463, 468, 640, 
645, 651, 654, 660, 662, 676, 683, 685, 689, 
691-692, 846, 890 . 
cooked terminal mode (精细 加 工 终端 模式 )，632 
cooperating processes (合作 进程 )，455，717，883 
Coordinated Universal Time， 见 UTC 
coprocesses (协同 进程 )，510-514，680，701 
copy-on-write ( 写 时 复制 )，211，417 
core dump (core 转 储 )，70，870 
core file (core 文 件 ),，104, 116, 256, 291, 293, 296, 
307, 340, 641, 663, 857, 863, 865 
COSE (Common Open Software Environment) (公共 开放 
软件 环境 ) 32 
cp program (cp 程序 )，131 ，490 
cpio program (cpio 程 序 )，117，131-132，858-859 
CR terminal character (CR 终端 字符 ) 638, 640, 663 
CRO constant (CR0 常 量 )，645 
CR1 constant (CR1 常 量 )，645 
CR2 constant (CR2 常 量 )，645 
CR3 constant (CR3 常 量 )，645 
CRDLY constant (CRDLY 常 量 )，637，644-645，649 
CREAD constant (CREAD 常 量 )，635，646 
creat function (creat MB), 59, 62-63, 65, 75, 85, 
95, 97, 110, 113, 117, 139, 306, 411, 451, 592, 
857, 860 
definition of (creat RMX), 62 
creation mask, file mode (文件 模式 创建 屏蔽 字 )，97-98， 
119，131，215，234，425 
cron program (cron##F*), 354, 425, 430-432, 434, 
868 
CRTS, IFLOW constant (CRTS_IFLOW##), 635, 646 
CRTSCTS constant (CRTSCTS 常 量 ) 635, 646 
CRTSXOFF constant (CRTSXOFFÉ ER), 635, 646 
crypt function (crypt HB), 263, 273, 279-280, 402 
crypt program (crypt 程 序 )，273，660 
CS5 constant (CS5 常 量 ) 644, 646 
CS6 constant (CS6 常 量 ) 644, 646 
CS7 constant (CS7 常 量 ) 644, 646 
CS8 constant (CS8 常 量 )，644，646，666-668 
CSIZE constant (CSIZE 常 量 )，635，644，646，666-667 
csopen function (csopen 国 数 ) 615-616 
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definition of (csopen RAHI SL), 616, 621 
CSRG (Computing Science Research Group) (计算 科学 研 
RA), 35 
CSTOPB constant (CSTOPBH#), 635, 646 
ctermid function (ctermidm), 401, 412, 654, 
660-661 
definition of (ctermi dA), 654 
ctime function (ctimepg NK), 174-176, 402 
definition of (ctime RAIL), 175 
ctime r function (ctime r& EA), 402 
cu program (cu 程序 ) 473 
cupsd program (cupsdf#F#), 425, 757 
curseslibrary (cursesHE), 672-673, 887, 890 
cuserid function (cuseriaq 国 数 )，257 


D 


daemon (守护 进程 )，423-439 
coding (守护 进程 编码 )，425-428 
conventions (守护 进程 惯例 )，434-439 
error logging (守护 进程 出 错 日 志 )，428-432 
daemonize function (daemonizeR Rt), 425, 428, 439, 
571, 573, 578, 624, 778, 844, 871-872 
definition of (Gaemonize 国 数 的 定义 ) 426 
Dang, X.T., 188, 887 
Darwin, 35 
data segment (数据 段 ) 
initialized (初始 化 的 数据 段 ) 187 
uninitialized (未 初始 化 的 数据 段 )，187 
data transfer (数据 传输 )，565-579 
data types ，primitive system (基本 系统 数据 类 型 )，56 
data, out-of-band ( 带 外 数据 )，581-582 
database library (AEEA), 709-752 
coarse-grained locking (fH), 718 
concurrency (JE), 718-719 
fine-grained locking ( 细 锁 ) 718 
implementation (实现 ) 712-715 
performance (性 能 ) ，747-752 
source code ( 源 代 码 ) 719-747 
database transactions (数据 库 事 务 )，889 
date functions, time and (时 间 和 日 期 函数 )，173-176 
date program (Gate 程 序 )，175, 178, 346, 862, 882 
Date, C.J., 719, 886 
DATEMSK environment variable (DATEMSK 环 境 变量 ) 193 
db library (db 库 )，710，889 
DB structure (DB 结构 )，722-724，726-728，731-734，739， 


742, 748 
db. close function (db_closem%), 710-711, 715, 
727 


definition of (db_close 函 数 的 定义 )，710 
db delete function (db_deletemBr), 711, 718, 
734-735, 737, 883 
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definition of (ab_dqelete 国 数 的 定义 )，711 
db. fetch function (db_fetch$), 711, 713, 715, 
718, 728, 733 
definition of (db_fetch RHES), 711 
DB_INSERT constant (DB_INSERT 常 量 ), 711, 715, 740 
db. nextrec function (db nextreciR E), 712, 715, 
718, 735, 745, 747, 752, 883 
definition of (Gb, nextrecH SE X), 712 
db. open function (db_openpi¥t), 710-712, 715, 718, 
721-723, 725-727, 747 
definition of (db_open PAA S), 710 
DB_REPLACE constant (DB REPLACETÉSRE), 711, 740 
db, rewind function (db_rewindp¥), 712, 745, 747 
definition of (Gb_rewind 函 数 的 定义 )，712 
DB_STORE constant (DB_STORE 常 量 ), 711, 740 
db, store function (db_store%), 711-712, 715, 
718, 720, 735, 737, 740, 747, 750, 752 
definition of (db_store SEX), 711 
DBHANDLE data type (DBHANDLE 数 据 类 型 ) 715 
dbm library (abm 库 )，709-710，890 
dbm clearerr function (Gbm_clearerr 国 数 )，402 
dbm_close function (abm_close 图 数 )，402，412 
dbm delete function (dbm_qelete 国 数 )，402，412 
dbm error function (Gabm_error 国 数 ) 402 
dbm_fetch function (dbm fetchigEr), 402, 412 
dbm_firstkey function (dbm_firstkeyi%x), 402 
dbm_nextkey function (dbm nextkeyB ZR), 402, 412 
dbm, open function (dom opengEK SE), 402, 412 
dbm store function (dbm_storepi%), 402, 412 
dcheck program (Gcheck 程 序 )，114 
dd program (Gd 程序 )，256 
deadlock ( 死 锁 ) 216, 373, 450, 513, 680 
avoidance (避免 死 锁 ) 373 
record locking (记录 锁 死 锁 ) 450 
delayed write (延迟 写 )，77 
descriptor set (描述 符 集 )，475，477，493，875 
detachstate attribute (GetachstatefffE), 389-390 
dev. t datatype (dev_t 数 据 类 型 )，57，127-128 
devts file system (devfs 文 件 系统 )，129 
device number 
major ( 主 设备 号 )，56-57，127，129，659 
minor (次 设备 号 ) 56-57, 127, 129, 659 
device special file 〈 设 备 特殊 文件 ) 127-129 
device, STREAMS clone (STREAMS clone 设 备 ) 683 
df program (dF), 131, 858 
DIR structure (DIR&##J), 7, 121, 260, 657 
directories 
files and (文件 和 目录 )，4-7 
reading ( 读 目录 )，120-125 
directory (目录 )，4 
file (文件 目录 )，88 


home (起 始 目录 ),，2, 7, 125, 193, 264, 267 
ownership (目录 所 有 权 )，95 
parent ( 父 目录 )，4，101, 116, 119 
root ( 根 目录 ), 4, 7, 24, 129, 131, 215, 234, 260, 
858 
working (工作 目录 ), 7, 13, 43, 49, 107, 125-126, 
162, 193, 215, 234, 291, 426 
dirent structure (airent 结 构 ) 5, 7, 121, 123, 657 
dirname function (dirnamepi%x), 402 
DISCARD terminal character (DISCARD 终 端 字符 ) 638, 
640，647 
dlclose function (GQlclose 图 数 )，412 
dlerror function (Glerror 国 数 )，402 
dlopen function (GLopen 图 数 )，412 
do driver function (Go_ariver 国 数 )，696，704 
definition of (do_driver MAS), 704 
Dorward, S., 211, 889 
DOS, 55 
dot， 见 current directory 
dot-dot， 见 parent directory 
drand48 function (drand48 žr), 402 
DSUSP terminal character (DSUSP #34277), 638, 640, 
648 
du program (Gu 程序 ) 104, 
Duff, T., 84 
dup function (dupt), 51, 59, 70, 73, 76-77, 138, 
153, 213, 306, 428, 452-453, 548, 855-856, 864 
definition of (aup 国 数 的 定义 )，76 
dup2 function (aup2 图 数 )，62，76-77，86，138，306， 
501, 506, 512, 548, 573-574, 588, 617, 693, 
704-708, 855 
definition of (dup2 函 数 的 定义 )，76 


E 


131, 857-858 


E2BIG error (E2BIG#HIR), 526 

EACCES error (EACCESTÉIR), 14-15, 433-434, 447, 
459, 861 

EAGAIN error (EAGAIN$ÉIR), 16, 433-434, 442, 444, 
447, 456-457, 459, 525, 531-532, 564, 582, 687 

EBADF error (EBADFEEIR), 51 

EBADMSG error (EBADMSG#HIR), 470 

EBUSY error (EBUSYSÉIR), 16, 371, 380 

ECHILD error (ECHILD 错 误 ) 308, 326, 345, 508 

ECHO constant (ECHO 8), 636, 646-647, 661, 665- 
667, 696, 844 

echo program (echo 程 序 )，185 

ECHOCTL constant (ECHOCTLÆ Æ), 636, 646 

ECHOE constant (ECHOE 常 量 ) 636, 646-647, 661, 696 

ECHOK constant (ECHOK 常 量 ) 636, 647, 661, 696 

ECHOKE constant (ECHOKE##), 636, 647 

ECHONL constant (ECHONL#f at), 636, 647, 661, 696 
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ECHOPRT constant (ECHOPRT 常 量 ) 636, 646-647 
ecvt function (ecvt HBL), 402 
ed program (edf F), 342, 344-345, 456-457 
EEXIST error (EEXIST#i#), 112, 520 
EFBIG error (EFBIGÉÉR), 868 
effective 
group ID (AZ ID), 91-92, 94-95, 101, 103, 130, 
167, 210, 214, 237, 241, 520, 543, 605 
user ID (473% FA AID), 91-92, 94-95, 99, 103, 117, 
130, 210, 214, 235, 237-241, 257, 262, 264, 
312, 354, 520, 524, 530, 535, 542-543, 593, 
600, 605, 771, 861, 866 
efficiency 
VO (VORB), 68-70 
standard 1/0 (标准 IO 效率 ) ，143-145 
EIDRM error (EIDRM 错 误 ) 524-526, 530-532 
EINPROGRESS error (EINPROGRESS 错 误 )，563 
EINTR error (EINTR 错 误 )，16，246-247，303-304，313， 
334, 345, 475, 480, 507-508, 525-526, 532, 575 
EINVAL error (EINVAL£ÉiR), 42, 47, 320, 361, 367, 
464, 466, 505, 507, 665-667 
EIO error (EIO##i#), 284, 297, 686 
ELOOP error (ELOOP 错 误 ) 113-114 
EMSGSIZE error (EMSGSIZE 错 误 ) 566 
ENAMETOOLONG error (ENAMETOOLONG 错 误 ) 62 
encrypt function (encrypt 图 数 )，402 
endgrent function (enagrent 国 数 ) 167-168, 402, 
412 
definition of (endqgrent 国 数 的 定义 ) ，167 
endhostent function (endhostent MH), 412, 553 
definition of (ndqhostent 国 数 的 定义 ) 553 
endnetent function (enanetent 图 数 )，412，554 
definition of (enanetent 国 数 的 定义 ) ，554 
endprotoent function (endprotoent aX), 412, 554 
definition of (enaprotoenteR ABUSE X.), 554 
endpwent function (endpwent MH), 164-165, 402, 
412 
definition of (endpwent HARI SL), 164 
endservent function (endservent WAX), 412, 555 
definition of (endqservent 图 数 的 定义 ) 555 
endspent function (endspent yx), 166 
definition of (endspent 函 数 的 定义 )，166 
endutxent function (endutxent MiB), 402, 412 
ENFILE error (ENFILES# IR), 16 
ENOBUFS error (ENOBUFS 错 误 )，16 
ENODEV error (ENODEV 错 误 ) 466 
ENOENT error (ENOENT 错 误 )，15，405，686，711 
ENOLCK error (ENOLCK 错 误 )，16 
ENOMEM error (ENOMEM 错 误 )，16 
ENOMSG error (ENOMSG 错 误 )，526 
ENOSPC error (ENOSPCEÉEIR), 16, 405 
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ENOSR error (ENOSR#HR), 16 
ENOSTR error (ENOSTR 错 误 ) 466 
ENOTDIR error (ENOTDIR 错 误 )，548 
ENOTTY error (ENOTTY 错 误 )，466，643，653 
environ variable (environ 变 量 )，185-186，193，195， 
232，236，404-405，409，863 
environment list (环境 列表 ) ，185-186，215，233，262- 
264 
environment variable (环境 变量 )，192-195 
COLUMNS, 193 
DATEMSK, 193 
HOME, 192-193, 264 
IFS, 250 
LANG, 41, 193 
LC_ALL, 193 
LC_COLLATE, 42, 193 
LC_CTYPE, 193 
LC_MESSAGES, 193 
LC_MONETARY, 193 
LC, NUMERIC, 193 
LC, TIME, 193 
LD LIBRARY, PATH, 719 
LINES, 193 
LOGNAME, 193, 257, 264 
MAILPATH, 192 
MALLOC OPTIONS, 870 
MSGVERB, 193 
NLSPATH, 193 
PAGER, 501, 504-505 
PATH, 93, 193, 232-233, 235, 242, 244, 247, 264- 
265 
PWD, 193 
SHELL, 193, 264, 701 
TERM, 193, 263, 265 
TMPDIR, 157-158, 193 
TZ, 174, 176, 178, 193, 862 
USER, 192, 264 
ENXIO error (ENXIORHE), 515 
EOF constant (EOF 2E 3&), 10, 141, 143-144, 154, 160, 
507, 509, 512-513, 587, 624, 694, 861 
EOF terminal character (EOF 终 端 字 符 ) 638, 640, 646- 


647, 660, 663 

EOL terminal character (EOL £7), 638, 640, 647, 
660, 663 

EOL2 terminal character (EOL2 终 端 字符 ) 638, 640, 647, 
660, 663 


EPERM error (EPERMEÉIR), 238 

EPIPE error (EPIPERÉIR), 499, 878 

Epoch (Fit), 20, 22, 117, 171, 173-174, 600 
ERANGE error (ERANGE 错 误 ) ，49 

ERASE terminal character (ERASE 终 端 字符 )，638，640， 
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646-647, 662-663 
ERASE?2 terminal character (ERASE2 终 端 字符 ) 638, 641 
err dump function (err_dumpH%), 340, 733, 845. 
846 
definition of (err_qdump 函 数 的 定义 )，848 
err exit function (err exitiKNE), 845-846 
definition of (err_exit BRRIE ML), 847 
err_msg function (err_msg PH), 845-846 
definition of (err_msg 国 数 的 定义 ) 848 
err quit function (err_duit 国 数 )，7，778，845-846， 
860 
definition of (err_quit ARRIEN), 848 
err_ret function (err retEAZ&), 771, 845-846, 860 
definition of (err_ret BRAIN), 847 
err sys function (err_sysfA%), 7, 24, 771, 845. 
846 
definition of (err_sys 国 数 的 定义 ) 847 
errno variable (errno 变 量 )，14-15,，24，42，49，54， 
62, 64, 77, 112-113, 134, 238, 246, 284, 290, 
297, 303-304, 306-308, 312-313, 320, 326, 334, 
345, 353, 356, 358, 406, 413, 431, 434, 442, 
444, 447, 459, 475, 480, 499, 508, 515, 526, 
548, 563-564, 566, 582, 643, 653, 711, 767, 
782, 846, 854, 868 
error 
handling (出 错 处 理 )，14-16 
logging, daemon (守护 进程 出 错 记 录 ) 428-432 
recovery (出 错 恢复 ) 16 
routines, standard (标准 出 错 处 理 例 程 )，846-851 
ESPIPE error (ESPIPE 错 误 )，64，548 
ESRCH error (ESRCH 错 误 )，312 
ETIME error (ETIME 错 误 )，763，767 
ETIMEDOUT error (ETIMEDOUT 错 误 ) 384 
EWOULDBLOCK error (EWOULDBLOCK##iR), 16, 442, 
564, 582 
exec function (exec pH#L), 10-12, 22, 39, 42, 78, 94, 
113, 116-117, 179, 183, 185, 206, 211, 215-216, 
231-240, 242-243, 245-246, 248, 250, 252, 256, 
259-260, 262-264, 266-267, 270, 280, 300-301, 
347, 416-417, 452, 489, 495, 500, 503, 519, 
541, 615-616, 620-621, 629, 676, 678, 680, 682, 
692, 704, 707, 863, 870, 886 
execl function (exec] RX), 231-233, 242-243, 247, 
253, 255-256, 260, 264, 345-346, 501, 506, 512, 
573, 588, 617, 702, 865 
definition of (exec] ARIZ), 231 
execle function (execle MHZ), 231-233, 235-236, 263, 
306 
definition of (exec1le 国 数 的 定义 ) 231 
execlp function (exec1p 国 数 )，11-13，19，231-233 ， 
235-236, 245, 247, 260, 704, 865 


definition of (execlpPARRIT X.), 231 
execv function (execv 贸 数 ) 231-233 
definition of (execv JÆ% ), 231 
execve function (execve HR), 231-233, 235, 306, 
865 
definition of (execve ARIE X.), 231 
execvp function (execvpi£2&), 231-233, 235, 695-696 
definition of (execvp RAE), 231 
exercises, solutions to (习题 答案 )，853-883 
exit function (exit), 7, 140, 144, 180-184, 207, 
213, 216-221, 228, 231, 246-247, 252-253, 255- 
256, 260, 264, 305, 340-341, 360, 407, 425, 
504, 665, 696, 707, 771, 780, 793, 843, 863- 
864, 882 
definition of (exit 函数 的 定义 )}，180 
exit handler (终止 处 理 程序 ) 182 
expect program (expect 程 序 )，679，703-705，888 
exponential backoff (指数 补偿 )，562 
ext2 file system (ext2 文 件 系 统 ) ，69，82，95,119 
ext3 file system (ext3 文 件 系统 )，95，119 
EXTPROC constant (EXTPROC 常 量 ) 636, 647 


F 


F DUPFDconstant (F_DUPFD##), 77-79, 548 

F_FREESP constant (F. FREESPAE HE), 105 

F_GETFD constant (F. GETFD?E SE), 78-79, 548 

F_GETFL constant (F_GETFL 常 量 ) 78-81, 548 

F GETLK constant (F GETLE7É S), 78, 446-450 

F GETOWN constant (F_GETOWN# BRE), 78-79, 548, 582 

F_OK constant (F OKT$ ER), 96 

F RDLCK constant (F_RDLCK# BR), 446-447, 449-450, 
845, 873-874 

F_SETFD constant (F_SETFD# SE), 78-79, 81, 86, 548, 
855 

F SETFL constant (F SETFLAE 4), 78-79, 81, 86, 482, 
548, 583, 855, 882 

F SETLK constant (F SETLKTÉ HE), 78, 446-448, 450, 
454, 845, 873-874 

F SETLKW constant (F. SETLEWTÉE BE), 78, 446-448, 
450, 845, 873 

F SETOWN constant (F. SETOWN TÉ RE), 78-79, 482, 548, 
581-583, 880-881 

F UNLCK constant (F_UNLCK #8), 446-447, 449-450, 
845 

F_WRLCK constant (F_WRLCK##), 446-447, 449-450, 
454, 845, 873 

Fagin, R., 710, 715, 886 

fatal error (致命 错误 )，16 

fattach function (£attachiKE), 589, 592-593 

definition of (fattach 国 数 的 定义 ) 589 
fchdir function (£chdirgg ZR), 125-127, 548 
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definition of (fchdirMRnye MZ), 125 
fchmod function (£chmodER SE), 99-101, 112, 117, 
306, 458, 548 
definition of (fchmod 函 数 的 定义 )，99 
fchown function (fchown 国 数 ) 102-103, 117, 306, 
548 
definition of (fchown MARIE X.), 102 
fclose function (fclose), 138-140, 181, 183, 
340-341, 412, 507, 661 
defintion of (fclose 国 数 的 定义 ) 139 
fcnt1l function (fcnt1 国 数 )，5$9，73，76-83，86，105 ， 
138, 153, 203, 234, 306, 411-412, 442, 445, 
447-450, 452, 454-455, 482, 548, 581-583, 749- 
751, 880-882 
definition of (fcnt1 国 数 的 定义 ) 78 
fcvt function (f£cvt BH), 402 
FD CLOEXEC constant (FD CLOEXECTÉ E), 78-79, 234 
FD CLR function (FD CLRES), 476, 625, 875 
definition of (FD_CLR 函 数 的 定义 ),， 476 
FD_ISSET function (FD_ISSET 国 数 ) 476, 625, 875 
definition of (FD_ISSET MRR), 476 
fd set data type (fdq_set 数 据 类 型 ) 57, 475-476, 493, 
625, 779-780, 874, 879 
FD SET function (FD SETERSE), 476, 625, 875 
definition of (FD SETERER)dE X.), 476 
FD_SETSIZE constant (FD SETSIZET E), 477, 874 
FD ZERO function (FD ZEROERS), 476, 625, 875 
definition of (FD_ZERO 函 数 的 定义 )，476 
fdatasync function (fdatasync 国 数 )，77-78，82-83， 
306, 548 
definition of (fdatasync MARI), 77 
fdetach function (fdetach a), 590 
definition of (fdetach 函 数 的 定义 )，590 
fdopen function (fdopen 函 数 )，138-140，506，877 
definition of (fdopen 扩 数 的 定义 )，138 
feature test macro (特征 测试 宏 )，55-56，81 
Fenner, B., 147, 266, 429, 545, 890 
feof function (feof 函 数 )， 141, 146 
definition of (feof MARI SL), 141 
ferror function (ferror RX), 10, 
146, 254, 500, 505, 512, 588 
definition of (£errortANER) X), 141 
FFO constant (FF0 常 量 ) 647 
FF1 constant (FF1 常 量 ) 647 
FFDLY constant (FFDLY #4), 637, 644, 647, 649 
fflush function (fflushpA%), 135, 137, 139, 160, 
341, 412, 508-510, 514, 662, 680, 849, 851, 
854, 861 
definition of (£flushmf Rug x), 137 
fgetc function (fgetc HH), 140-141, 144-145, 412 
definition of (fgetc 国 数 的 定义 ) 140 
fgetpos function (fgetpos 国 数 ) 147-148, 412 


141，143-144， 
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definition of (fgetpos 国 数 的 定义 ) 148 
fgets function (fgets), 9, 11-12, 19, 140, 142- 
145, 156, 159, 196, 198, 412, 500, 505, 509, 
512-514, 570, 577, 587, 616, 703, 718, 807, 
859, 861, 877 
definition of (fgets 国 数 的 定义 ) 142 
fgetwc function (fgetwc 国 数 )，412 
fgetws function (fgetws At), 412 
FIFOs, 89, 496, 514-518, 589 
file (文件 ) 
access permissions (文件 访问 权限 )，92-94，130 
block special ( 块 特殊 文件 )，89，128-129 
character special (字符 特殊 文件 )，89，128-129，461， 
466, 659 
descriptor passing (文件 描述 符 传递 ) 543, 601-614 
descriptor passing, socket (fi X tETEGAR AEB), 
606-614 
descriptor passing, STREAMS (STREAMS X 4-438 fT 
传递 ) 604-606 
descriptors (文件 描述 符 ) 8-10, 59-60 
device special (设备 特殊 文件 ) 127-129 
directory (目录 文件 )，88 
group (组 文件 )，166-167 
holes (文件 空洞 )，65-66，104-105 
mode creation mask (文件 模式 创建 屏蔽 字 )，97-98， 
119, 131, 215, 234, 425 
offset (文件 偏 移 最 ) 63-65, 71-74, 76, 213-214, 
454, 484, 713-714, 856 
ownership (文件 所 有 权 )，95 
pointer (文件 指针 )，134 
regular (普通 文件 ) 88 
sharing (文件 共享 )，70- 73，213 
size (文件 大 小 )，103-105 
times (XEFE), 115-116, 493 
truncation (文件 截 短 ) 105 
types (文件 类 型 ) 88-91 
FILE structure (FILE£ÉEJ), 121, 133-134, 141, 153- 
154, 156, 202, 217, 254, 402-403, 500, 504-505, 
507, 509, 577, 661, 720, 872 
filesystem (文件 系统 )，4，105-108 
devfs, 129 
ext2, 69, 82, 95, 119 
ext3, 95, 119 
HSFS, 105 
PCFS, 48, 55, 105 
$5, 62 
UFS, 48, 55, 62, 105, 108, 119 
filename (文件 名 ) 4 
truncation (文件 名 截 短 ) 62 
FILENAME MAX constant (FILENAME_MAX 常 最 ) 38 
fileno function (filenopg T), 153, 506-507, 661, 
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861 
definition of (fileno 国 数 的 定义 ) ，153 
FILEPERM constant (FILEPERM 常 量 ) ，762，788 
files and directories (文件 和 目录 ) 4-7 
FILESIZEBITS constant (FILESIZEBITS 常 量 ) 39, 43, 
48 
find program (finq 程 序 ) 116, 125, 234 
finger program (finger##FF), 131, 163, 858 
FIOASYNC constant (FIORASYNC 常 最 ) 583, 880-881 
FIOSETOWN constant (FIOSETOWNT7É RE), 583 
HIPS, 33 
Flandrena, B., 211, 889 
flock function (£1ockpAME), 445 
flock structure (Elock 结 构 ) 446, 448-449, 454 
flockfile function (£lockfilePS 4), 402-403 
definition of (fiockfile 函 数 的 定义 )，403 
FLUSHO constant (FLUSHO 常 量 )，636，640，647 
FMNAMESZ constant (FMNAMESZ 常 量 ) 466 
fmtmsg function (fmtmsg 函 数 )，193 
FNDELAY constant (FNDELAY 常 量 ) 442 
foo_alloc function (foo_alloc 国 数 )，372 
foo_find function (£oo, findpA NK), 376 
foo hold function (£oo holdgAE), 376 
foo rele function (£oo reletg fr), 376 
fopen function (£opengK), 5, 134, 138-140, 154, 
202, 254, 412, 500-501, 504, 661, 872 
definition of (fopen 国 数 的 定义 )，138 
FOPEN_MAX constant (FOPEN, MAXTÉ E), 38, 42 
foreground process group (前 台 进 程 组 ),， 272-278, 280-281, 
286, 294, 296-297, 343, 350, 424-425, 463, 
640-642, 645, 649, 670, 706, 882 
foreground process group ID (前 台 进 程 组 ID) ，274，278， 
637 
fork function (fork 国 数 ) 11-12, 19, 22, 73, 210-219, 
223-225, 227-231, 235-236, 240, 242, 245-248, 
250-253, 255-256, 259, 262, 264, 266-267, 270- 
271, 279, 282-284, 287, 301, 306, 309, 345-347, 
354, 416-421, 425-428, 430, 451-453, 458-459, 
473, 489, 495-501, 503, 506-507, 511, 519, 527, 
539, 541, 544, 573-574, 587, 602, 615-617, 
620-621, 629, 675, 680, 682-683, 691-692, 697, 
704, 747, 865-866, 870-871, 873, 876, 878, 880, 
886 
definition of (fork 函 数 的 定义 )，211 
fork1 function (fork1 pm), 211 
Fowler, G.S., 125, 887, 890 
fpathconf function (fpathconf aX), 37, 39-48, 
52-54, 103, 121, 306, 499, 639 
definition of (fpathconf MRE), 41 
FPE FLTDIV constant (FPE_FLTDIV#&), 327 
FPE FLTINV constant (FPE_FLTINV##), 327 





FPE FLTOVF constant (FPE_LFLTOVF #4), 327 
FPE FLTRES constant (FPE FLTRESTE E), 327 
FPE_FLTSUB constant (FPE FLTSUBfÉEE), 327 
FPE FLTUND constant (FPE FLTUND?ÉSE), 327 
FPE INTDIV constant (FPE INTDIVT1E E), 327 
FPE, INTOVF constant (FPE INTOVFE E), 327 


fpos, t datatype (fpos_t 数 据 类 型 )，57，147 
fprintf function (fprintf), 149, 412, 854 
definition of (fprintf mee), 149 
fputc function (fputcreh#), 135, 142, 144-145, 412 
definition of (fputcH BRIM), 142 
fputs function (fputsmB), 136, 140, 142-145, 154, 
156, 159, 412, 505, 509, 512, 587, 661, 849, 
851, 859, 862, 877 
definition of (fputs 国 数 的 定义 )，143 
fputwc function (fputwc 国 数 )，412 
fputws function (fputws 国 数 ) 412 
fread function (fread 国 数 )，140，145-147，250，254， 
412 
definition of (fread BRAVE), 146 
free function (freet), 157, 159, 189-192, 306, 
372, 374-376, 378, 410, 657, 728 
definition of (free 函 数 的 定义 )，189 
freeaddrinfo function (freeaddrinfo 国 数 ) 555 
definition of (freeaddqrinfo 国 数 的 定义 ) 555 
FreeBSD, 3, 21, 26-27, 29-30, 35-36, 38, 48, 55, 58, 
60, 62, 65, 78-79, 84, 95, 101-103, 112, 119, 
122, 128, 162, 166, 169, 171-172, 176, 191, 
193-194, 204, 206-207, 211, 222, 227, 242-243, 
250-251, 257, 264-265, 268, 278, 285, 290-292, 
295, 298, 304-305, 308, 310, 326, 330, 333, 
348, 352, 357, 360, 364, 445, 452-453, 457, 
459, 474-475, 496, 521, 523, 529, 534, 538, 
550-551, 566-568, 583, 588, 596, 610-611, 614, 
635-638, 645-651, 676, 682-683, 692, 705-706, 
710, 876, 888 
freopen function (£reopenERSE), 134, 138-140, 412 
definition of (freopen 国 数 的 定义 ) 138 
fscanf function (fscanf paz), 151, 412 
definition of (fscanf 国 数 的 定义 ) 151 
fsck program (fsck 程 序 ) 114 
fseek function (fseek 国 数 )，139，147-148，412 
definition of (fseek 国 数 的 定义 ) 147 
fseeko function (fseeko 国 数 )，147-148，412 
definition of (fseekc 国 数 的 定义 ) 148 
fsetpos function (fsetpos 国 数 )，139，147-148，412 
definition of (fsetpos 国 数 的 定义 ) 148 
fstat function (fstat mz), 4, 87-88, 112, 306, 458, 
491, 497, 542, 548, 658, 725, 796 
definition of (fstat 国 数 的 定义 ) 87 
fsync function (fsvnc 国 数 )，5$9，77-78，82-83，160， 
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306, 411, 489, 548, 752, 861 
definition of (fsync 国 数 的 定义 ) 77 
ftell function (ftell 国 数 )，147-148，412 
definition of (ftel RRR), 147 
ftello function (ftelloffi#t), 147-148, 412 
definition of (fte11o 国 数 的 定义 ) 148 
ftok function (ftok 国 数 )，519 
definition of (ftok 国 数 的 定义 ) 519 
ftpd program (ftpd 程 序 )，431，871 
ftruncate function (ftruncate 国 数 )，105，117，306， 
491, 548 
definition of (ftruncate 国 数 的 定义 ) 105 
ftrylockfile function (ftrylockfile 国 数 )，402- 
403 
definition of (ftzrylockfile 国 数 的 定义 ) 403 
fts function (fts 国 数 )，122 
ftw function (fcw 国 数 )，113-114，120-125，131，402， 
412, 858 
full-duplex pipes (全 双 工 管道 )，496 
named (命名 全 双 工 管道 )，496 
function prototypes (函数 原型 )，807-841 
functions, system calls versus (系统 调用 与 函数 )，21-23 
funlockfile function (funlockfilesfi#), 402-403 
definition of (funlockfile 国 数 的 定义 )，403 
fwide function (fwiae 国 数 )，134 
definition of (fwide 国 数 的 定义 ) 134 
fwprintf function (fwprintf 国 数 )，412 
fwrite function (fwrite 国 数 )，140，145-147，354， 
412，868 
definition of (fwrite 国 数 的 定义 ) 146 
fwscanf function (fwscanf 国 数 ) 412 


G 


gai strerror function (gai_strerror 国 数 ) 556, 

571, 574, 576, 578 
definition of (gai_strerror Mine), 556 

Gallmeister, B. O., 887 

Garfinkel, S., 165, 232, 273, 887 

gather write (聚集 写 ) 483, 607 

gawk program (gawkfgHr), 243 

gcc program (gccfEH), 6, 26, 56 

gcvt function (gcvt ia), 402 

gdb program (gdb 程 序 ) 870 

gdbm library (gdbm 库 )，710 

generic pointer (通用 指针 )，68，190 

get newjobno function (get_newjobnopA%), 783, 
788 

get printaddr function (get printaddrfATE), 766, 
782 

get printserver function (get_printserver AR), 
766, 770 
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getaddrinfo function (getaddrinfofh%), 555-557, 
559-560, 569-571, 574, 576, 578, 764, 770 
definition of (getaddrinfo 国 数 的 定义 ) 555 
getaddrlist function (getaddrlist Ha), 764, 770 
GETALL constant (GETALLÆ Æ), 530 
getc function (getc 国 数 ) 10, 140-143, 145, 153-154, 
412, 661-662, 861 
definition of (getc 函 数 的 定义 )，140 
getc_unlocked function (getc_unlocked 国 数 )， 
402-403, 412 
definition of (getc_unlocked 国 数 的 定义 ) 403 
getchar function (getchar 国 数 )，140，154，160， 
412, 509, 861 
definition of (getchar 国 数 的 定义 )， 140 
getchar, unlocked function (getchar_unlocked 国 
®t), 402-403, 412 
definition of (getchar_unlocked RAYE X), 403 
getconf program (getconf 程 序 ) 67 
getcwd function (getcwd 函 数 )，49，125-127，132， 
190, 412, 859-860 
definition of (getcwd RAI ML), 126 
getdate function (getdatef%k), 193, 402, 412 
getegid function (getegiq 国 数 )，210，306 
definition of (getegid 函 数 的 定义 )，210 
getenv function (getenv 函 数 )，186，192-194，402-405， 
409-410, 421, 501, 870 
definition of (getenv 国 数 的 定义 ) 192 
getenv_r function (getenv_r 国 数 )，404-405 
geteuid function (geteuid 国 数 )，210，238-239，249， 
306，612，771 
definition of (geteuid 函 数 的 定义 )，210 
getgid function (getgid 函 数 )，17，210，306 
definition of (getgid 函 数 的 定义 )，210 
getgrent function (getgrent 国 数 ) 167-168, 402, 
412 
definition of (getgrent 国 数 的 定义 ) 167 
getgrgid function (getgrgid 国 数 )，166，402，412 
definition of (getgrgid 函 数 的 定义 )，166 
getgrgid r function (getgrgid_r 国 数 )，402，412 
getgrnam function (getgrnam 国 数 )，166，402，412， 
687 
definition of (getgrnam 国 数 的 定义 ) 166 
getgrnam r function (getgrnam_r 国 数 )，402，412 
getgroups function (getgroups 国 数 )，168，306 
definition of (getgroups 国 数 的 定义 ) ，168 
gethostbyaddr function (gethostbyaqdqr 国 数 ) 402, 
412, 553, 555 
gethostbyname function (gethostbyname 国 数 ) 402, 
412, 553, 555 
gethostent function (gethostent Hx), 402, 412, 
553 
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definition of (gethostent 国 数 的 定义 ) 553 
gethostname function (gethostnameM#), 39, 42, 
172, 412, 571-573, 578, 778 
definition of (gethostname 国 数 的 定义 ) ，172 
getlogin function (getlogin 国 数 ) 256-257, 402, 
412，439，871-872 
definition of (getlogin 国 数 的 定义 ) 256 
getlogin r function (getlogin_r 国 数 )，402，412 
getmsg function (getmsg 国 数 )，411，461-463，469-472， 
493, 548, 605, 705, 875 
definition of (getmsg 国 数 的 定义 ) 469 
getnameinfo function (getnameinfo 国 数 )，556 
definition of (getnameinfo 国 数 的 定义 )，556 
GETNCNT constant (GETNCNT 常 量 )，530 
getnetbyaddr function (getnetbyaddr%), 402, 
412, 554 
definition of (getnetbyaddr 函 数 的 定义 )，554 
getnetbyname function (getnetbyname 国 数 )，402， 
412, 554 
definition of (getnetbyname 国 数 的 定义 ) 554 
getnetent function (getnetent 国 数 )，402，412，554 
definition of (getnetent 国 数 的 定义 ) ，554 
getopt function (getopt 国 数 )，402，624，694，696， 
770，773-774 
definition of (getopt 国 数 的 定义 ) 774 
getpass function (getpass 国 数 )，263，273，660， 
662-663 
definition of (getpass 国 数 的 定义 ) 661 
getpeername function (getpeername 国 数 )，306，561 
definition of (getpeername 国 数 的 定义 ) 561 
getpgid function (getpgid 函 数 )，269 
definition of (getpgigd 函 数 的 定义 ) 269 
getpgrp function (getpgrp 函 数 )，269，306 
definition of (getpgrp 国 数 的 定义 )，269 
GETPID constant (GETPID 常 量 ) 530 
getpid function (getpid%), 11, 210, 212, 217, 
253, 284, 306, 341, 351, 359, 434, 612, 881 
definition of (getpid 函 数 的 定义 )，210 
getpmsg function (getpmsgtASE), 411, 461-463, 469- 
470, 548 
definition of (getpmsg 国 数 的 定义 ) 469 
.getppid function (gecppid 国 数 )，210-211，306，451， 
697 
definition of (getppid 国 数 的 定义 ) 210 
getprotobyname function (getprotobyname AR), 
402, 412, 554 
definition of (getprotobyname 国 数 的 定义 ) ，554 
getprotobynumber function (getprotobynumber fA 
x), 402, 412, 554 
definition of (getprotobynumber MRM), 554 
getprotoent function (getprotoent pM), 402, 412, 
554 


definition of (getprotoent 国 数 的 定义 ) 554 
getpwent function (getpwent 国 数 )，164-165，402， 
412 
definition of (getpwent 国 数 的 定义 ) 164 
getpwnam function (getpwnamp%), 161-165, 170, 
256, 263, 306-308, 402, 412, 779, 861-862 
definition of (getpwnam A KRIJEN), 163-164 
getpwnam r function (getpwnam rtANE), 402, 412 
getpwuid function (getpwuidBiS), 161-165, 170, 
256-257, 402, 412, 771, 861 
definition of (getpwuid 国 数 的 定义 ) 163 
getpwuid r function (getpwuid_r 国 数 )，402，412 
getrlimit function (getrlimitm%), 52, 202, 205, 
426-427, 854-855 
definition of (getrlimit 国 数 的 定义 )，202 
getrusage function (getrusage 国 数 )，227，258 
gets function (gets 国 数 ) 142-143, 412, 859 
definition of (gets 国 数 的 定义 )，142 
getservbyname function (getservbyname 国 数 ) 402, 
412, 555 
definition of (getservbyname 国 数 的 定义 ) 555 
getservbyport function (getservbyport 国 数 ) 402, 
412, 555 
definition of (getservbyport MARIE), 555 
getservent function (getservent HH), 402, 412, 
555 
definition of (getservent ARKEN), 555 
getsid function (getsid 国 数 )，271 
definition of (getsid 函 数 的 定义 )，271 
getsockname function (getsockname 国 数 )，306，561 
definition of (getsockname 国 数 的 定义 ) 561 
getsockopt function (getsockopt 国 数 )，306，579- 
580 
definition of (getsockopt MARIE), 579 
getspent function (getspent AX), 166 
definition of (getspent 国 数 的 定义 ) 166 
getspnam function (getspnam 国 数 )，166，861 
definition of (getspnam 国 数 的 定义 )，166 
gettimeofday function (gettimeofday 国 数 )，173， 
176，383，398 
definition of (get timeofday AAI), 173 
getty program (getty 程 序 ) 220, 262-266, 431 
gettytabfile (gettytabo ft), 263 
getuid function (getuidpi), 17, 210, 238-239, 
249, 256-257, 306, 687 
definition of (getuid 函 数 的 定义 )，210 
getutxent function (getutxent MH), 402, 412 
getutxid function (getutxidpANE), 402, 412 
getutxline function (getutxlinej Ne), 402, 412 
GETVAL constant (GETVAL# 4), 530 
getwc function (getwc 国 数 )，412 
getwchar function (getwchar 国 数 )，412 
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getwd function (getwd ph), 412 
GETZCNT constant (GETZCNT# A), 530 
GID, ‘group ID 
gid_t datatype (gid 上 数据 类 型 )，57 
Gingell, R.A., 188, 487, 887 
glob function (globi), 412 
global variables (全 局 变量 ) 201 
gmtime function (gmt ime pa%), 174-175, 402 
definition of (gmtimeRQARye X.), 175 
gmtime r function (gmtime_r 图 数 ) 402 
GNU, 2, 265, 719 
GNU Public License (GNU 公用 许可 证 )，35 
Goodheart, B., 672, 887 
goto, nonlocal (dEzkHbgotoBEs&), 195-202, 329-333 
grantpt function (grantptER), 682-685, 688-691, 
707 
definition of (grantptERTL Ey E XL), 682, 687, 690 
grep program (grepfiIY), 20, 159, 182, 234, 887 
group file (组 文件 ) 166-167 
group ID (f8ID), 17, 237-241 
effective (有 效 组 ID ) 91-92, 94-95, 101, 103, 130, 
167, 210, 214, 237, 241, 520, 543, 605 
real (Scl ZgID), 91-92, 95, 167, 210, 214, 234. 
235, 237, 251, 541 
supplementary (ARAID), 18, 39, 91-92, 94, 101, 
103, 167-168, 214, 234, 241 
group structure (ZH£E&J), 166, 687 
guardsize attribute (guardsizett), 389, 392 


H 


half-duplex pipes ( 半 双 工 管道 ) 496 
hard link 〈 硬 链接 ) 4, 107, 109, 112, 114 
hcreate function (函数 ) 402 
hdestroy function (函数 )，402 
headers 
optional (可 选 头 文件 )，30 
POSIX required (POSIX 要 求 的 头 文件 ) 29 
standard (标准 头 文件 ) 27 
XSI extension (XSI 扩 展 头 文件 ) 30 
heap ( 堆 )，187 
Hein, T. R., 889 
Hewlett-Packard, 36, 798 
holes, file (XAM), 65-66, 104-105 
home directory (起 始 目 录 )，2, 7, 125, 193, 264, 267 
HOME environment variable (HOME 环境 变量 ) 192-193, 
264 
HOST NAME, MAX constant (HOST_NAME_MAX 常 最 ) 39, 
42, 48, 172, 570-573, 577-578, 778 
hostent structure (hostent4##yJ), 553 
hostname program (hostname), 173 


索 al 731 


HP-UX，36 

hsearch function (hsearchigd&), 402 

HSFS file system (HSFS 文 件 系 统 )，105 

htoni function (hton] s%%), 550, 797 
definition of (hton] ARIS), 550 

htons function (htons pia), 550, 797 
definition of (htons HRA), 550 

HTTP (Hypertext Transfer Protocol) ( 超 文本 传输 协议 )， 

756 

Hume, A.G., 159, 887 

HUPCL constant (HUPCL 常 量 ) 635, 647 

Hypertext Transfer Protocol, HTTP 


i-node (iA), 57, 71-72, 88, 101, 105, 107-108, 
112, 115-117, 120-121, 128-129, 163, 287, 453, 
658, 853, 858 

IO 

asynchronous (异步 UO) 473, 481-482 

asynchronous socket (异步 赛 接 字 1/O)，582-583 

efficiency (IO 效率 ) 68-70 

library, standard (标准 IO 库 ) 9, 133-160 

memory-mapped (内 存 映 射 7O) 487-492 

multiplexing (IO 多 路 转 接 、LUO 多 路 复 用 ) 472-481 

nonblocking ( 非 阻 塞 UO ) 441-444 

nonblocking socket ( 非 阻 塞 亦 接 字 IO ) 563-564, 582- 
583 

terminal (£t3gVO), 631-673 

unbuffered 〈 不 带 缓冲 的 HO) 8, 59-86 

I_CANPUT constant (I CANPUT EH), 465 

I.FINDconstant (I FINDE), 684-685 

I_GRDOPT constant (I_GRDOPT 常 量 ) 470 

I_GWROPT constant (I_GWROPT #4), 468 

I LIST constant (I_LIST# RE), 466-467 

I_PUSH constant (I PUSH?7É E), 593, 685 

I_RECVFD constant (T_RECVFD# 4%), 593, 600, 604- 
606 

I_SENDFD constant (I_SENDFD# HE), 604-605 

I_SETSIG constant (I SETSIGTÉ Æ), 482 

I SRDOPT constant (I SRDOPTAE RE), 470 

I. SWROPT constant (I_SWROPT# E), 468 

IBM (International Business Machines), 36 

ICANON constant (ICANON# E), 636, 638, 640-642, 
646-647, 651, 663, 665-667 

iconv. close function (iconv, closei& S), 412 

iconv, open function (iconv, openER T), 412 

ICRNL constant (ICRNL 常 量 ) 635, 640, 648, 660, 
666-668 

identifiers (标识 符 ) 

IPC (IPC 标 识 符 )，518-520 
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process 〈 进 程 标识 符 ) 209-210 
IDXLEN_MAX constant (IDXLEN_MAX #4), 745 
IEC, 25 
IEEE (Institute for Electrical and Electronic Engineers) (Œ, 
气 与 电子 工程 师 协 会 )，26-27，887 
IEXTEN constant (IEXTEN##), 636, 638, 640-642, 
648, 666-668 
IFS environment variable (IFS 环 境 变量 ) 25 
IGNBRK constant (IGNBRK##), 635, 645, 648 
IGNCR constant (IGNCR 常 量 ) 635, 640, 648, 660 
IGNPAR constant (IGNPAR# E), 635, 648, 650 
ILL, BADSTK constant (ILL_BADSTK##), 327 
ILL_COPROC constant (ILL_COPROC# Ht), 327 
ILL ILLADR constant (ILL_ILLADR##), 327 
ILL, ILLOPC constant (ILL ILLOPCTÉ SE), 327 
ILL ILLOPN constant (ILL ILLOPN?É EE), 327 
ILL ILLTRP constant (ILL ILLTRP?É EE), 327 
ILL, PRVOPC constant (ILL_PRVOPC##H), 327 
ILL PRVREG constant (ILL_PRVREG##), 327 
IMAXBEL constant (IMAXBEL/E 3), 635, 648 
implementation differences, password (口令 实现 差别 )， 
169 
implementations, UNIX System (UNIX 系 统 实现 ) 33 
in_addr_t data type (in_addr_t 数 据 类 型 )，551 
in_port_t datatype (in_port_t 数据 类 型 )，551 
INADDR_ANY constant (INADDR_ANY 常 量 )，561 
incore (在 主 存 ) 70 
INET6 ADDRSTRLEN constant (INET6_ADDRSTRLEN# 
&), 552 
inet, addr function (inet_addrpA%%), 552 
INET ADDRSTRLEN constant (INET_ADDRSTRLEN# Æ), 
552, 559-560 
inet, ntoa function (inet ntoatASE), 402, 552 
inet ntop function (inet_ntop 国 数 ) 552, 560 
definition of (inet_ntop 国 数 的 定义 ) 552 
inet_pton function (inet_ptonti®), 552 
definition of (inet_Pton 国 数 的 定义 ) 552 
inetd program (inetq 程 序 ) 266-268, 425, 430-431 
INFTIM constant (INFTIM# 4), 480 
init program (init 程 序 ) 171, 173, 210, 219-220, 
228, 262-266, 268, 282-283, 287, 295, 312, 350, 
425, 434, 866, 871 
init, printer function (init printer(A*X€), 778, 
782, 796 
init, request function (init, requesti A), 778, 
781 
initgroups function (initgroupsEA SD), 168, 264 
definition of (initgroups HAREM), 168 
initialized data segment (初始 化 的 数据 段 )，187 
initserver function (initserver 国 数 )，570-572 ， 
574, 577-578, 763, 779 





definition of (initserver 国 数 的 定义 ) 564, 580 
inittab file (inittab 文 件 )，295 
INLCR constant (INLCR##), 635, 648 
ino t datatype (ino_t 数 据 类 型 )，57，107 
INPCK constant (INPCK 常 量 ) 635, 648, 650, 666-668 
Institute for Electrical and Electronic Engineers, AIEEE 
int16_t datatype (int16_t 数据 类 型 )、794 
INT MAX constant (INT_MAX#4), 38 
INT_MIN constant (INT MINTÉAE), 38 
International Business Machines, M, IBM 
International Standards Organization, Jd, ISO 
Internet Printing Protocol, Jd IPP 
Internet worm (因特网 蠕虫 )，142 
interpreter file (解释 器 文件 ) 242-246, 260 
interprocess communication (进程 闻 通 信 )， 见 IPC 
interrupted system calls (中 断 的 系统 调用 ) 303-305, 317- 
318，326，329，339，481 
INTR terminal character (INTR 终 端 字 符 ) 638, 641, 648, 
661 
IOBUFSZ constant (IOBUFSZ 常 量 ) 799 
ioctl function (ioct1%), 59, 83-84, 86, 273, 297, 
303-304, 412, 442, 460-462, 464-468, 470, 482, 
524, 548, 583, 587, 593, 600, 604-606, 634, 
670-671, 684-685, 689-690, 692-693, 695, 705- 
707, 880-881 
definition of (ioct 1 MMe), 83 
ioctl operations, STREAMS (STREAMS ioct1 操 作 )， 
464 
IOV_MAX constant (ILOV_MAX##44), 40, 42, 48, 483 
iovec structure (iovec 结 构 ) 40-42, 483, 566, 608- 
609, 611, 613, 617, 621, 737, 799 
IPC (interprocess communication) (进程 间 通 信 )，495-544， 
585-629 
identifiers (IPC 标 识 符 )，518-520 
key (IPC 键 )，518-520，524，529，534 
XSI, 518-522 
IPC_CREAT constant (IPC_CREAT# BE), 519-520 
IPC, EXCL constant (IPC_EXCL##H), 520 
IPC NOWAIT constant (IPC NOWAIT 4), 525-526, 
531-532 
ipc, perm structure (ipc_perm###y), 520, 524, 529, 
534, 543 
IPC PRIVATE constant (IPC PRIVATETÉBE), 519, 537, 
542, 544 
IPC RMID constant (IPC_RMID##), 524-525, 530; 
535-537 
IPC_SET constant (IPC SET), 524-525, 530, 535 
IPC.STAT constant (IPC_STAT#H 4), 524-525, 530, 
535 
ipcrm program (ipcrmf FF), 521 
ipcs program (ipcs#FF), 521, 544 
IPP (Internet Printing Protocol) (因特网 打印 协议 ) 753- 
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756 

ipp.hheader (ipp .hn 头 文件 ) 805 

IPPROTO_IP constant (IPPROTO_IP 常 量 ) 579 

IPPROTO_RAW constant (IPPROTO_RAN 常 量 ) 558 

IPPROTO_TCP constant (IPPROTO_TCP#4#), 558, 579 

IPPROTO_UDP constant (IPPROTO_UDP# 4), 558 

IRIX, 36 

is_read_lockable function (is read  lockablefáü 
Æ), 450, 845 

is write lockable function (is write, lockable 
国 数 ) 450, 845 

isastream function (isastream 国 数 )，464-465，467， 
594 

definition of (isastream 国 数 的 定义 )，465 

isatty function (isattyH%), 464-465, 639, 655, 

658-659, 671, 694, 702 
definition of (isatty 国 数 的 定义 )， 655 

ISIG constant (ISIG# Æ), 636, 638, 640-642, 648, 
666-668 

ISO (International Standards Organization) (国际 标准 化 组 
£R), 25-27, 887 

ISOC, 25-26, 887 

Israel, R. K., 462, 889 

ISTRIP constant (ISTRIPTÉ Ht), 635, 648, 650, 666- 
668 

IUCLC constant 

IXANY constant 

IXOFF constant 

IXON constant 
668 


IUCLC##), 635, 649 

IXANY# 4), 635, 649 

IXOFF# Æ), 635, 641-642, 649 
IXONT HE), 635, 641-642, 649, 666- 


J 


jmp. buf data type (jmp_buf 数 据 类 型 )，198，200，315， 
318 
job control (作业 控制 )，274-278 
shell (作业 控制 shell 程 序 )，270，274，280，283，300， 
333, 350, 699 
signals (作业 控制 信号 ) 349-352 
job. find function (job_find 国 数 )，869 
job remove function (job_remove 国 数 ) ，869 
Jolitz, W.F, 34 
Joy, W.N., 3, 71 
jsh program (jshRUT), 275 


K 


Karels, M. J., 33-34, 70, 104, 108, 211, 218, 461, 
487, 888 

kdump program (kdump 程 序 ) 457 

kernel (内 核 )，! 

Kernighan, B. W., 26, 139, 145, 151, 153, 190, 243, 


846, 854, 885, 887 

key, IPC (IPCBE), 518-520, 524, 529, 534 

key. t datatype (key. 数据 类 型 )，518 

kill function (kill MR), 18, 253, 283-284, 290, 
300, 306, 310-313, 327, 338, 341-342, 351-352, 
354, 414, 416, 639, 641, 662, 697-608, 867, 
874 

definition of (kill 函数 的 定义 )，312 

kill program (ki11 程 序 ) 290-291, 296, 300, 513 

KILL terminal character (KILL 终 端 字符 ) 638, 641, 647, 
662-663 

kill workers function (kill_workers%), 791- 
793 

Kleiman, S.R., 71, 887 

Knuth, D.E., 730, 888 

Korn shell (Korn shell 程 序 ) 3, 52, 86, 158, 192, 204, 
265, 275, 457, 510, 662, 698-699, 701, 877, 
886 

Korn, D.G., 3, 125, 159, 510, 886-888, 890 

Kovach, K.R., 521, 885 

Krieger, O., 159, 492, 888 

ktrace program (ktracefF), 457 


L 


164a function (164a 国 数 ) 402 

L.ctermid constant (L_ctermid# Æ), 654 

L_tmpnam constant (L_tmpnam 常 量 )，156 

LANG environment variable (LANG 环 境 变量 ) 41, 193 

last program (last 程 序 )，171 

layers, shell (shell 层 )，274 

LC_ALL environment variable (LC_ALL 环 境 变 最 ) 193 

LC_COLLATE environment variable (LC_COLLATE 环 境 变 
最 )，42，193 l 

LC_CTYPE environment variable (LC_CTYPE 环 境 变 量 )， 
193 

LC. MESSAGES environment variable (LC_MESSAGES 环 境 
"EBE), 193 

LC MONETARY environment variable (LC_MONETARY 环 境 
AEH), 193 

LC. NUMERIC environment variable (LC_NUMERIC 环 境 变 
RD, 193 

LC TIME environment variable (LC_TIME 环 境 变量 ) 193 

lchown function (1chown pf), 102-103, 112-113, 117 

definition of (1chowntRIERzE X), 102 

1d program (1d 程 序 )，189 

LD_LIBRARY_PATH environment variable ( LD_ 
LIBRARY_PATH 环 境 变 量 ) 719 

LDAP (Lightweight Directory Access Protocol) ( 轻 量 级 目 
录 访 问 协 议 ) 169 

idterm STREAMS module (1dterm STREAMS 模 块 )， 
468，676，685 
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leakage, memory (内 存 泄 漏 ) 191 
least privilege (最 小 优先 级 ) 237, 758, 779 
Lee, M., 188, 887 
Lee, T.P., 886 
Leffler, S.J., 34, 888 
Lennert, D., 888 
Lesk, M.E., 133 
lgamma function (1gammaph#), 402 
lgammaf function (lgammaf H% ), 402 
lgammal function (1gammal iz), 402 
Libes, D., 679, 867, 888 
libraries, shared (共享 库 ) 188-189, 207, 719, 863, 
885 
Lightweight Directory Access Protocol, LDAP 
limit program (limit), 52, 204 
limits (BRA), 36-52 
C (CHR), 38 
POSIX (POSIX 限 制 )，38-40 
resource (资源 限制 )，202-206，21$，234，297，354 
runtime indeterminate (不 确定 的 运行 时 限制 )，48-52 
XSI (XSI), 40-41 
line control, terminal I/O (终端 VO 行 控制 )，653-654 
LINE MAX constant (LINF_MAX 常 量 )，39，42，48 
LINES environment variable {LINES 环 境 变量 )}，193 
link count 〈 链 接 计 数 )，43，57，107-109，120 
link function (1ink 函 数 )，7$，107-114，117，306 
definition of (1ink 函 数 的 定义 ) 109 
link, hard ( 硬 链接 ) 4, 107, 109, 112, 114 
symbolic (符号 链接 ) 88-89, 102-103, 107, 110, 112- 
H4, 121, 127, 131, 170, 856-857 
LINK MAX constant (LINK MAX7ÉTE), 39, 43, 48, 107 
lint program (1int 程 序 ) 182 
Linux, 2-3, 14, 21, 26-27, 29-30, 35-36, 38, 40, 48, 
51, 55, 58, 60, 62, 69-72, 82-84, 91, 95, 101- 
103, 112, 114, 119, 122, 128, 154, 162, 166, 
169, 171-172, 176, 187, 191, 193-194, 203-204, 
207, 211, 222, 227, 242-243, 250-251, 255, 
264-265, 268, 278, 280, 290, 292-296, 298, 
304-305, 308, 310, 326, 329-330, 333, 348, 352, 
357, 360, 364, 424, 437, 445, 455-457, 460-461, 
464, 474-475, 484, 492, 496, 521, 523, 529, 
533-535, 537-538, 540, 550-552, 566-568, 583, 
585, 595, 610-612, 614, 635-638, 644-651, 653, 
676, 683, 686, 689, 691-692, 705-706, 710, 719, 
876 
Linux STREAMS, 496 
Lions, J., 888 
LiS, 496 
listen function (1isten 国 数 ) 306, 561, 563-564, 
581, 597-598, 762 
definition of (1isten 国 数 的 定义 ) 563 


little-endian byte order (小 端 字 节 序 ) 549 
Litwin, W., 710, 715, 888 
LLONG_MAX constant (LLONG, MAX TEE), 38 
LLONG MIN constant (LLONG_MIN# Æ), 38 
In program (1n 程 序 ) 107 
LNEXT terminal character (LNEXT 终 端 字符 ) 638, 641 
LOCAL, PEERCRED constant (LOCAL_PEERCRED# RE), 
612 
locale (本 地 )，42 
localeconv function (1ocaleconvERÉÉ), 402 
localtime function (localtimePhr), 174-176, 246, 
402, 862 
definition of (localtime MARIE), 175 
localtime, r function (localtime rH), 402 
lock, reg function (lock_reg 4%), 448, 845, 873- 
874 
definition of (1ock regu X), 449 
lock test function (lock_test HH), 449-450, 845 
definition of (1ock test HRA), 449 
lockf function (lockfp%), 411, 445 
lockf structure (1ockf 结 构 ) 453 
lockfile function (Lockfile 国 数 )，433 
definition of (1ockfile 国 数 的 定义 ) 454 
locking 
database library, coarse-grained (数据 库 函 数 库 粗 锁 )， 
718 
database library, fine-grained (数据 库 函 数 库 细 锁 )， 
718 
locking function (lockingM#), 445 
log function (Logh), 429 
LOG ALERT constant (LOG, ALERTE BE), 431 
LOG, AUTH constant (LOG, AUTHTÉ 4), 431 
LOG AUTHPRIV constant (LOG_AUTHPRIV# 4), 431 
LOG, CONS constant (LOG. CONS KÆ), 428, 430 
LOG_CRIT constant (LOG CRIT EE), 431 
LOG, CRON constant (LOG, CRONTEE) , 431 
LOG, DAEMON constant (LOG_DAEMON# HK), 428, 431 
LOG, DEBUG constant (LOG_DEBUG# HK), 431 
LOG, EMERG constant (LOG_EMERG# SK), 431 
LOG ERR constant (LOG ERR7É RE), 431, 433, 435-436, 
438, 570-574, 577-578, 850 
LOG, FTP constant (LOG, FTP2E KE), 431 
LOG INFO constant (LOG INFO7ÉRE), 431, 435, 437 
LOG, KERN constant (LOG. KERN7É RE), 431 
LOG LOCALO constant (LOG LOCALO 2 K), 431 
LOG  LOCAL1 constant (LOG LOCALITÉEE), 431 
LOG LOCAL2 constant (LOG, LOCAL2 # RE), 431 
LOG, LOCAL3 constant (LOG, LOCAL37E Rc), 431 
LOG, LOCAL4 constant (LOG. LOCAL4 4$ RE), 431 
LOG, LOCAL5 constant (LOG. LOCAL5*2 RE), 431 
LOG, LOCAL6 constant (LOG_LOCAL6##), 431 
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LOG_LOCAL7 constant (LOG_LOCAL7 4$ Rt), 431 
LOG_LPR constant (LOG_LPR##), 431 
LOG_MAIL constant (LOG_MRAIL 常 量 ) 431 
log_msg function (1og_msg 国 数 ) 845-846 
definition of (1og_msg 国 数 的 定义 )，850 
LOG, NDELAY constant (LOG_NDELAY 常 量 ) 430, 871 
LOG, NEWS constant (LOG_NEWS 人 常量 )，431 
LOG NOTICE constant (LOG_NOTICE 常 量 )，431 
log. open function (1og_open 国 数 ) 624, 845 
definition of (1og_open 国 数 的 定义 ) 849 
LOG_PERROR constant (LOG_PERROR# MH), 430 
LOG_PID constant (LOG_PID 常 量 ) 430, 624 
log quit function (1og quit), 793, 845-846 
definition of (log_quit MRR), 850 
log. ret function (log_ret Hat), 845-846 
definition of (log_ret ARIE), 849 
log_sys function (1og_sys 国 数 ) 766, 782, 845-846 
definition of (1og systASEBUz X), 850 
LOG, SYSLOG constant (LOG_SYSLOG# 4), 431 
log. to. stderr variable (log_to_stderrH), 624, 
776, 849, 851 
LOG_USER constant (LOG_USER# 4), 431, 624 
LOG, WARNING constant (LOG_WARNING# Œ), 431 
logger program (logger 程 序 )，432 
login accounting (登录 账户 记录 )，170-171 
login name (登录 名 )，2, 17, 125, 163, 171, 193, 256- 
257, 266, 439, 871 
root (Hi, GRAF), 16 
login program (login##FF), 163, 166, 168, 171, 
233, 236, 238, 257, 263-267, 431, 660, 678, 
703 
LOGIN NAME MAX constant (LOGIN_NAME_MAX# HO), 
39, 42, 48 
logins (登录 ) 
network (PUSH), 266-268 
terminal (终端 登录 ) ，261-266 
LOGNAME environment variable (LOGNAME 环 境 变 量 )，193， 
257, 264 
LONG_BIT constant (LONG_BIT#4), 40 
LONG. MAX constant (LONG, MAX), 38, 51, 58, 
854-855 
LONG_MIN constant (LONG_MIN#4), 38 
longjmp function (longjmp HH), 179, 195, 197-201, 
206, 305, 307, 315, 317-318, 329-331, 333, 340, 
354, 867 
definition of (longjmp 函 数 的 定义 )，197 
loop function (1oop 国 数 ) 624, 626, 629, 696, 707 
definition of (loop RAIL), 626, 697 
lp program (1p 程 序 ) 541, 757 
lpc program (lpc##FF), 431 
lpd program (1pdfRIF), 431, 757 


lpsched program (1pscheq 程 序 ) 541, 757 
lrand48 function (1rand48) 9), 402 
1s program (1s#J¥), 5-6, 8, 13, 100-101, 104, 114, 
116, 121, 125, 129, 131, 161, 163, 521, 853 
lseek function (lseek HH), 8, 57, 59, 63-67, 72-75, 
84, 86, 139, 148, 306, 412, 420, 446, 449, 
454, 458, 491, 548, 629, 732, 856 
definition of (lseek ARIE), 63 
lstat function (lstat PAR), 87-88, 90-91, 113-114, 
123, 131, 306 
definition of (1statiErBgsE X), 87 


M 


M DATA STREAMS message type (M. DATA STREAMS? 
ERE), 463-464, 468 

M_ERROR STREAMS message type (M_ERROR STREAMS 
消息 类 型 ) 482 

M_HANGUP STREAMS message type ( M_HANGUP 
STREAMS 消 息 类 型 ) 482 

M_PCPROTO STREAMS message type (M_PCPROTO 
STREAMS EA), 463-464 

M_PROTO STREAMS message type (M_PROTO STREAMS 
消息 类 型 ) 463-464 

M. SIG STREAMS message type (M. SIG STREAMS 消 息 类 
RI), 463 

Mac OS X, 3, 16, 26-27, 29-30, 35-36, 38, 48, 54-55, 
58, 60, 62, 78-79, 82, 84, 95, 101-103, 112, 
119, 122, 128, 162, 166, 168-169, 171-172, 176, 
191, 193-194, 204, 222, 227, 242-243, 250-251, 
257, 264-265, 268, 278, 290-293, 295, 298, 
304-305, 308, 310, 326, 330, 348, 352, 357, 
360, 445, 457, 474-475, 484, 496-497, 521, 523, 
529, 534, 538, 550, 566-568, 583, 596, 610, 
635-638, 645-651, 676, 683, 692, 705-706, 710, 
876 

Mach, 35, 885 

macro, feature test (特征 测试 宏 )，55-56，81 

MAILPATH environment variable (MAILPATH 环 境 变量 )， 
192 

main function (mainb#), 7, 140, 145, 179-182, 184, 
186, 197-199, 207, 218-219, 231, 260, 306-308, 
332-333, 428, 587, 616, 618, 624, 694, 704, 
771, 774, 777, 780, 787, 793, 796, 863, 865, 
867, 880, 882 

major device number ( 主 设备 号 ) 56-57, 127, 129, 659 

major function (major p#), 128-129 

make program (make##FF), 275 

makethread function (makethreadpi#), 400 

mallinfo function (mallinfo 国 数 )，191 

malloc function (malloc 国 数 )，21-23，50，126，135， 
157, 159, 189-192, 195, 305-306, 308, 364, 
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371-372, 374, 376, 391, 398, 407, 409-410, 537, 
571, 573, 578, 608-609, 612-613, 622-623, 626, 
656, 868, 870 
definition of (malloc 函 数 的 定义 )，189 
MALLOC_OPTIONS environment variable (MALLOC 
OPTIONS 环 境 变 量 )，870 
mallopt function (malloptERE), 191 
man program (man 程 序 ) 239-240 
mandatory record locking (强制 记录 锁 ) 455 
MAP. ANON constant (MAP_ANON 常 量 ) 540 
MAP ANONYMOUS constant (MAP_ANONYMOUS 常 量 ) 540 
MAP FAILED constant (MAP_FAITLED##), 491, 539 
MAP, FIXED constant (MAP_FIXED# $), 488-489 
MAP PRIVATE constant (MAP_PRIVATE# HK), 488, 490, 
540 
MAP. SHARED constant (MAP_SHARED# Æ), 488, 490- 
491, 538-540 
Mauro, J., 70, 105, 108, 889 
MAX, CANON constant (MAX_CANON 常 量 ) 39, 43, 46, 
48, 633 
MAX INPUT constant (MAX_INPUT# 44), 39, 43, 48, 
632 
MAXPATHLEN constant (MAXPATHLENTÉ S), 49 
MB LEN MAXconstant (MB LEN MAXjJÉ d), 38 
mbstate t structure (mbstate_t&##y), 401 
McDougall, R., 70, 105, 108, 889 
McGrath, G.J., 462, 889 
McKusick, M.K., 33-34, 70, 104, 108, 211, 218, 461, 
487, 888 
MDMBUF constant (MDMBUF# Ht), 635, 645, 649 
memccpy function (memccpy 国 数 ) 145 
memcpy function (memcpy 国 数 )，491-492 
memory 
allocation 【存储 器 分 配 ) 189-192 
layout (存储 空间 布局 ) ，186-188 
leakage (内 存 泄漏 )，191 
shared (共享 存储 器 ) 496, 533-540 
memory-mapped /O (内 存 映射 TO) 487-492 
message queues (消息 队列 )，496，522-527 
timing (消息 队 列 时 间 )，527 
messages, STREAMS (STREAMS 消 息 )，462 
mgetty program (mgetty 程 序 }，265 
MIN terminal value (MIN 终 端 值 ) 647, 663-664, 668, 
673，882 
minor device number (次 设备 号 ) 56-57, 127, 129, 659 
minor function (minor 国 数 ) 128-129 
mkdir function (mkGir 国 数 )，95，112-114，116-117 ， 
119-120，306，860 
definition of (mkdir 函 数 的 定义 )，119 
mkdir program (mkdir 程 序 )，119 
mkfifo function (mkfi fof), 112-113, 116-117, 306, 


514-515, 878 
definition of (mkfifomehy# X.), 514 
mkfifo program (mkfifofRHr), 515 
mknod function (mknodpMH), 112-113, 119, 515 
mkstemp function (mkstemppH#z), 155-159, 412 
definition of (mkstemp 国 数 的 定义 ) 158 
mktemp function (mktemp 国 数 )，158 
mktime function (mktime 国 数 )，174-176 
definition of，(mktime 国 数 的 定义 ) 175 
mlock function (mlock HR), 203 
mmap function (mmap), 159, 203, 391, 441, 487- 
489, 491-493, 538-540, 543, 548, 887 
definition of (mmap 尔 数 的 定义 }，487 
mode_t datatype (mode_t 数 据 类 型 )，57 
modem (调制 解 调 器 }，261，263，272，294，303，441， 
481, 631, 634-635, 645, 647, 649, 652 
Moran, J.P., 487, 887 
more program (moref#F*), 505, 714 
MORECTL constant (MORECTL¥ KK), 470 
MOREDATA constant (MOREDATA* EE), 470 
Morris, R., 165, 889 
mount function (mountr), 592 
mount program (mount 程 序 ) 95, 119, 129, 455 
mounted STREAMS-based pipes (已 装配 的 基于 STREAMS 
AYER), 495, 514, 518 
mprotect function (mprotect ia), 489 
definition of (mprotect MRR), 489 
mq receive function (nq. receivetfir), 411 
mq sendfunction (ng sendER A), 411 
mq timedreceive function (mq_timedreceive 函 数 )， 
411 
mg timedsend function (mq_t imedsendM#), 411 
mrand48 function (mrand48 0f), 402 
MS ASYNC constant (MS ASYNCTÉ EK), 490 
MS INVALIDATE constant (MS INVALIDATET 4), 490 
MS SYNC constant (MS_SYNC 常 量 ) 490-491 
MSG, ANY constant (MSG_ANY E), 469 
MSG BAND constant (MSG, BANDE &), 464, 469 
MSG CTRUNC constant (MSG_CTRUNC 常 量 ) 568 
MSG_DONTROUTE constant (MSG_DONTROUTE 常 量 ) 566 
MSG_DONTWAIT constant (MSG_DONTWAIT 常 量 ) 566, 
568 
MSG EOR constant (MSG_EOR# HK), 566, 568 
MSG_HIPRI constant (MSG, HIPRITÉSK), 464, 469 
MSG, NOERROR constant (MSG_NOERROR# fk), 526 
MSG, OOB constant (MSG, OOB4 &), 566-568, 581-582 
MSG PEEK constant (MSG_PEFK# &), 567 
MSG TRUNC constant (MSG_TRUNC 常 量 ) 567-568 
MSG WAITALL constant (MSG WAITALLT E), 567 
msgct1 function (msgct1 国 数 ) 520-521, 524 
definition of (msgct1 函 数 的 定义 )，524 
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msgget function (msqget HBr), 518-519, 521-524 
definition of (msgget KARHE), 524 
msghdr structure (msghdr###j), 566, 568, 606, 608- 
609, 611, 613 
msgrcv function (msgrcv 国 数 ) 411, 520-521, 523, 
526, 541 
definition of (msgrcv 国 数 的 定义 )，$26 
msgsnd function (msgsnd 国 数 )，411，$20-$S23，525S-S27 
definition of (msgsnd 函 数 的 定义 }，525 
MSGVERB environment variable (MSGVERB 环 境 变 量 )，193 
msqid_ds structure (msqid._ds 结 构 )，523-524，526 
msync function (msync 国 数 ) 411, 489-491 
definition of (msync 函 数 的 定义 )，490 
Mui, L., 672, 890 
multiplexing, VO (UO 多 路 复 用 ) 472-481 
munmap function (munmap 国 数 )，490 
definition of (nunmapERAEBzE X.), 490 
mv program (mv 程序 ) 107 
myftw function (myftwe%z), 123, 131 


N 


NAME, MAX constant (NAME MAX'ÉT&), 39, 43, 48, 54, 
62, 121 

named full-duplex pipes (命名 全 双 工 管道 )，496 

nanosleep function (nanosleep 国 数 )，348，398，400， 
41, 421 

nawk program (nawk 程 序 )，243 

NCCS constant (NCCS 常 量 ) 634 

ndbm library (ndbmJ£), 709-710 

Nemeth，E.，889 

netent structure (netent 结 构 )，554 

netinfo, 169 

Network File System, Sun Microsystems, W, NFS 

Network Information Service, W, NIS 

network logins (网 络 登录 ) 266-268 

network printer communication (网 络 打 印 机 通信 )，753- 
805 

Neville-Neil, G. V., 70, 104, 108, 888 

newgrp program (newgrpfgY), 167 

nfds_t datatype (nfds.t 数 据 类 型 )，479 

NFS (Network File System, Sun Microsystems)〔 网 络 文件 
系统 ，Sun Microsystems), 72, 752 

nftw function (nf tweh%z), 121-122, 402, 412 

NGROUPS, MAX constant (NGROUPS, MAX #4), 39, 42, 
48, 167-168 

Nievergelt, J., 710, 715, 886 

NIS (Network Information Service) (网 络 信息 服务 }，169 

NIS+, 169 

NL terminal character (NL 终端 字符 )，638，640-641，647， 
660, 663 

NLO constant (NLO 常 量 )，649 
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NLi constant (NLi 常 量 )，649 
NL ARGMAX constant (NL_ARGMAX 常 量 )，41 
nl ianginfo function (nl_langinfo 函 数 )，402 
NL_LANGMAX constant (NL_LANGMAX 常 量 )，41 
NL MSGMAX constant (NL, MSGMAX TÉ), 41 
NL NMAX constant (NL, NMAX EK), 41 
NL SETMAX constant (NL_SETMAX#f Ht), 41 
NL TEXTMAX constant (NL_TEXTMAX# #4), 41 
NLDLY constant (NLDLY# $Æ), 637, 644, 649 
nlink t datatype (nlink_t 数 据 类 型 )，57，107 
NLSPATH environment variable (NLSPATH 环 境 变 量 }，193 
nobody login name (nobody 登 录 名 )，162-163 
NOFILE constant (NOFILE 常 量 )，50 
NOFLSH constant (NOFLSH 常 量 ) 636, 649 
NOKERNINFO constant (NOKERNINFO 常 量 ) 636, 642, 
649 
nologin program (nologin 程 序 )，163 
nonblocking 
VO ( 非 阻塞 IJO) 441-444 
socket /O ( 非 阻塞 套 接 字 IO) 563-564, 582-583 
noncanonical mode, terminal UO (终端 IO 规范 模式 ) 663- 
670 
nonfatal error (4 站 FE 致命 错误 }，16 
nonlocal goto ( 非 局 部 goto)，195-202，329-333 
ntohl function (ntohl 国 数 )，$$0，804 
definition of (ntoh] RAIS), 550 
ntohs function (ntohsfRRt), 550, 560, 804 
definition of (ntohs 隙 数 的 定义 )，550 
NULL constant (NULL 常 量 )，786 
null signal (null 信 号 )，290，312 
NZERO constant (NZERO 常 量 )，41 


O 


O'Reilly, T., 672, 890 

O_ACCMODE constant (O_ACCMODE# &), 79-80 

O APPEND constant (O_APPEND##), 60, 63, 68, 72, 
74, 79-80, 139, 457 

O ASYNC constant (O ASYNCTÉ EE), 79, 482, 583 

O_CREAT constant (O_CREAT# i), 61, 63, 75, 85, 
112, 117, 433, 456-458, 491, 520, 715, 724, 
872 

O DSYNC constant (O DSYNCiÉ&), 61-62, 79 

O_EXCL constant (O_EXCL 常 量 ) 61, 75, 112, 520 

O_FSYNC constant (O_FSYNC# $Æ), 62, 79-80 

O_NDELAY constant (O_LNDELAY##), 36, 61, 442 

O_NOCTTY constant (O_LNOCTTY# 4), 61, 273, 426, 
681-682, 685 ， 

O_NONBLOCK constant (O_NONBLOCK##), 36, 61, 79- 
80, 442-443, 456, 458, 515, 565, 876, 878-879 

O_RDONLY constant (O. RDONLYTÉ SE), 60, 79-80, 94, 
96, 465, 467, 491, 616, 878 
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O_RDWR constant (O_RDWR# E), 60, 79-80, 94, 118, 
428, 433, 458, 491, 539, 594, 681, 684, 688, 
690-691, 715, 872 

O. RSYNC constant (O_RSYNC##), 61-62, 79 

O SYNC constant (O SYNCTÉEE), 61-62, 79-80, 82-83 

O. TRUNC constant (O. TRUNCÉ RE), 61, 63, 94, 105, 
117-118, 139, 456, 458, 491, 715 

O WRONLY constant (O_WRONLY# SE), 60, 79-80, 94, 
879 

OCRNL constant (OCRNL A), 637, 649 

od program (od 程序 )，66 

OFDEL constant (OFDEL 常 量 ) 637, 644, 649 

off_t datatype (off.t 数 据 类 型 }，57，64-67，147-148， 
738 

OFILL constant (OFILL 常 量 ) 637, 644, 649 

Olander, D.J., 462, 889 

OLCUC constant (OLCUC# «), 637, 649 

Olson, M., 889 

ONLCR constant (ONLCR# $), 637, 650, 696, 702 

ONLRET constant (ONLRET# $Æ), 637, 650 

ONOCR constant (ONOCR# RE), 637, 650 

ONOEOT constant (ONCEOT# $), 637, 650 

open function (open 国 数 ) 8, 14, 59-63, 74-75, 79, 
85-86, 94-97, 105, 110, 112-115, 117-118, 127, 
138-139, 260, 263, 273, 306, 411, 428-429, 433, 
442, 452-453, 455-458, 461, 465, 467, 487, 491, 
514-515, 518, 520-522, 539-541, 544, 547, 594, 
615, 618-619, 628-629, 645, 681, 684-686, 688- 
689, 691, 711, 723-724, 786, 855, 857, 872, 
878-879 

definition of (open 函 数 的 定义 }，60 

Open Software Foundation， 见 OSF 

OPEN MAX constant (OPEN. MAX'IERE), 39, 42, 48, 50- 
52, 58, 60, 854 

open, max function (open maxi XX), 426, 506, 626- 
627, 844 

definition of (open_max 国 数 的 定义 ) 51, 855 
opend.hheader (opend .h 头 文件 )，617，622，881 
opendir function (opendqir 国 数 )，$，7，113，120-125， 

234, 260, 412, 657, 858 

definition of (opendir RANI X), 120 

openlog function (openlog 国 数 ) 412, 428, 430, 
432, 439, 849, 871 

definition of (openlog RAYE X), 430 

OpenServer, 309, 445 

OPOST constant (OPOST# S), 637, 650, 666-668, 670 

optarg variable (optarg®#), 774 

opterr variable (opterr 8), 774 

optind variable (optind 变 量 ) 770 

option codes (选项 代码 )，31 

options (选项 )，52-55 


socket (FAT), 579-581 
optopt variable (optopt ait), 774 
ordering, byte ( 字 节 序 ) 549-550 
orientation, stream ( 流 定 向 }，134 
orphaned process group (孤儿 进程 组 )，282-285，428，699 
OSF (Open Software Foundation), 32 
out-of-band data ( 带 外 数据 )，581-582 
ownership 

directory (目录 所 有 权 )，95 

file (文件 所 有 权 )，95 
OXTABS constant (OXTABS 常 量 )，637，650 


P 


P_ALL constant (P ALLE), 226 
P_PGID constant (P_PGID 常 量 ) 226 
P PIDconstan (P_PID 常 量 ) 226 
P_tmpdir constant (P tmpdir (Y EE), 157-158 
packet mode, pseudo terminal (的 终端 打包 模式 )，705 
pagecache (页 面 高 速 缓存 ) 77 
page size (页 大 小 ) 535 
PAGE, SIZE constant (PAGE_STZE 常 量 ) 40, 42, 48 
pagedaemon process (页 守护 进程 )，210 
PAGER environment variable (PAGER 环 境 变量 ) 501, 
504-505 
PAGESIZE constant (PAGESIZEW TK), 39, 42, 48, 392 
PARENB constant (PARENB 常 量 ) 635, 648, 650, 666- 
668 
parent 
directory ( 父 目 录 ), 4, 101, 116, 119 
process ID ( 父 进程 站) 210, 215, 219, 225, 228, 
234, 263-264, 283, 424 
PAREXT constant (PAREXT#4t), 635, 650 
parity, terminal VO (终端 IO 奇 偶 校 验 ) 648 
PARMRK constant (PARMRK 常 量 )，635,，645，648，650 
PARODD constant (PARODD# SK), 635, 645, 648, 650, 
673 
passing, file descriptor (传送 文件 描述 符 ) 543, 601-614 
socket file descriptor ( 套 接 字 传 送 文件 描述 符 ) 606- 
614 
STREAMS file descriptor (STREAMS 文 件 描述 符 传送 )， 
604-606 
passwd program (passwdf#F#), 92, 166, 679 
passwd structure (passwd£E Kj), 161, 164, 307, 861- 
862 
password (E14) 
file (口令 文件 ) 161-165 
implementation differences (口令 实现 的 区 别 }，169 
shadow (阴影 日 令 )，165-166，178，861 
PATH environment variable (PATH 环境 变量 ) 93, 193, 
232-233, 235, 242, 244, 247, 264-265 
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path_alloc function (path_al loch), 123, 127, 
844, 860 
definition of, (path allocHREEBUsE X.), 49 
PATH MAX constant (PATH, MAXTÉ SK), 39, 43, 48-49, 
62, 132, 859 
pathconf function (pathconf px), 37, 39-50, 52-55, 
103, 113, 306, 499 
definition of (pathconf 函 数 的 定义 )，41 
pathname (路 径 名 )，5 
absolute (绝对 路 径 名 )，$，7，43，49，126，131， 
242, 859 
relative (相对 路 径 名 )，$，7，43，49，125 
truncation (WAR), 62 
pause function (pause 国 数 )，299-300，303，306，309， 
313-318, 331, 333, 340, 349, 411, 419, 671, 
867, 873 
definition of (pauseiK gag SL), 313 
PCFS file system (PCFSX(F RH), 48, 55, 105 
pekt STREAMS module (pekt STREAMS BEA), 676, 
705 
pclose function (pclosep#r), 249, 412, 503-510, 
571, 578, 877-878 
definition of (pclose 国 数 的 定义 )，S$03，5S07 
PENDIN constant (PENDIN 常 量 ) 636, 650 
permissions, file access (文件 访问 权限 )，92-94，130 
perror function (perror 国 数 ) 15-16, 24, 309, 352, 
412, 556, 853 
definition of (perror MALAI SL), 15 
pgrp structure (pgrp###J), 286-287 
PID, process ID 
pid_t datatype (pid_t 数 据 类 型 )，57，269，356 
Pike, R., 211, 887, 889 
pipe function (piper), 116-117, 138, 306, 497, 
499-500, 502, 506-507, 511, 513, 527, 588-589, 
593, 595, 876 
definition of (pipe RAY SZ), 497 
PIPE_BUF constant (PIPE BUFjTÉ d), 39, 43, 48, 493, 
499, 515-516, 590, 876 
pipes (#58), 496-503 
full-duplex (全 双 工 管道 )，496 
half-duplex ( 半 双 工 管道 )，496 
mounted STREAMS-based (装配 的 基于 STREAMS 的 管 
道 )，495,，514,518 
named full-duplex (命名 全 双 工 管道 )，496 
STREAMS-based (基于 STREAMS 的 管道 )，585-594 
Pippenger, N., 710, 715, 886 
Plan 9 operating system (Plan 9 操作 系统 )，211，889 
Plauger, P.J., 26, 153, 299, 889 
pointer, generic (通用 指针 )，68，190 
poll function (pol1 pH), 295, 305-306, 318, 411, 
441, 460-461, 474, 479-481, 493, 521, 542, 544, 


548, 563-564, 582, 621, 624, 626-627, 678, 696, 
707, 875, 878, 881 
definition of (pol MAHI X.), 479 
POLL, ERR constant (POLL_ERR# Ht), 327 
POLL HUP constant (POLL HUP), 327 
POLL _IN constant (POLL_IN#%&), 327-328 
POLL_MSG constant (POLL_MSG# E), 327-328 
POLL OUT constant (POLL_OUT# $Œ), 327-328 
POLL, PRI constant (POLL_PRI#%), 327 
POLLERR constant (POLLERR# Æ), 480 
pollfd structure (pol1fd#¥#j), 479, 626-627, 875 
POLLHUP constant (POLLHUP 常 量 ) 480-481, 627, 878 
POLLIN constant (POLLIN# $Æ), 480, 626-627, 878 
polling ( 轮 询 ) 228, 444, 473 
POLLNVAL constant (POLLNVAL# SK), 480 
POLLOUT constant (POLLOUT A ER), 480 
POLLPRI constant (POLLPRI#f E), 480 
POLLRDBAND constant (POLLRDBAND 常 量 ) 480 
POLLRDNORM constant (POLLRDNORM 常 量 ) ，480 
POLLWRBAND constant (POLLWRBANDTÉ SK), 480 
POLLWRNORM constant (POLLWRNORMTE RE), 480 
popen function (popenifSir), 23, 224, 231, 249, 412, 
503-510, 543-544, 570, 574, 577, 579, 877-878 
definition of (popen 函 数 的 定义 )，503，505 
Portable Operating System Environment for Computer 
Environments, IEEE, W, POSIX 
portmap program (portmap 程 序 ) 425 
POSIX (Portable Operating System Environment for 
Computer Environments, IEEE), 26-29, 34, 246 
POSIX.1, 27, 84, 243, 342, 507-508, 515, 545, 710, 
887 
POSIX.2, 243 
posix fadvise function (posix_fadvise 函 数 )，412 
posix fallocate function (posix_fallocate 国 数 )， 
412 
posix_madvise function (posix_madvise 国 数 )，412 
posix_openpt function (posix_openpt 国 数 ) 681- 
683，686，688-690 
definition of (posix_openpt 图 数 的 定义 )，681，686， 
689 
posix_spawn function (posix_spawmn 国 数 )，412 
posix_spawnp function (posix_spawnp 国 数 ) 412 
posix_trace_clear function (posix_trace_ clear 
ERE), 412 
posix_trace_close function (posix_trace_ close 
ERE), 412 
posix_trace_create function (posix_trace_ 
create 国 数 )，412 
posix_trace_create_withlog function (posix_ 
trace_create_withlogfh#r), 412 
posix_trace_event function (posix_trace_ event 
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函数 ) 306 
posix_trace_eventtypelist_getnext_id function 
(posix_trace_eventtypelist_ getnext id 
ERE), 412 
posix, trace eventtypelist, rewind function 
(posix trace eventtypelist rewindERME), 
412 
posix trace flush function (posix trace. flush 
函数 ) 412 
posix_trace_get_attr function (posix_trace_ 
get_attr 国 数 )，412 
posix_trace_get_filter function ( posix_ 
trace_get_filterme), 412 
posix_traceé_get_status function ( posix 
trace_get_statuspag), 412 
posix_trace_getnext_event function (posix_ 
trace_getnext_eventmae), 412 
posix_trace_open function (posix_trace_open 国 
Br), 412 
posix_trace_rewind function (posix_trace_ 
rewind), 412 
posix_trace_set_filter function ( posix_ 
trace_set_filterpm), 412 
posix_trace_shutdown function (posix_trace_ 
shutdown), 412 
posix_trace_timedgetnext_event function 
(posix_trace_timedgetnext_event Mx), 
412 
posix typed, mem open function (posix typed. 
mem opentRA), 412 
PPID, JU parent process ID 
pr program (Pr 程序 ) 719 
pr exit function (pr_exit Max), 221-223, 248-249, 
258, 346, 844 
definition of (pr_exit 国 数 的 定义 ) 222 
pr mask function (pr_mask 函 数 )，331，334-335，844 
definition of (pr_mask nye X.), 321 
PR_TEXT constant (PR TEXTTÉdE), 771, 788, 798 
pread function (preadbhBt), 74-75, 411, 420 
definition of (pread 国 数 的 定义 ) 75 
Presotto, D.L., 211, 585, 592, 889 
primitive system data types (基本 系统 数据 类 型 )，56 
print program (Print 程序 )，7$7，763，783，787-788， 
798, 805 
print.h header (print.hk XE), 778, 783, 788 
printd program (printdfHr), 757, 805 
printer communication, network (网 络 打 印 机 通信 )，753- 
805 
printer spooling (打印 机 假 脱 机 )，757-758 
source code ( 源 代码 }，758-805 
printer, status function (printer_status mx), 


799, 801, 805 
printer, thread function (printer_threadM%), 
795 
printf function (printf), 10, 21, 41, 140, 149, 
151-152, 160, 175-176, 201, 204, 207, 213, 217, 
260, 283, 306, 323, 412, 514, 863 
definition of (printf ARKJE), 149 
printreq structure (printreq###j), 763, 771, 783, 
786, 790 
printresp structure (printresp 结 构 )，763 
privilege, least (S&k;] Vp), 237, 758, 779 
proc structure (proc), 286-287 
process (进程 )，10 
accounting 《进程 会 计 ) 250-256 
control (进程 控制 )，11，209-260 
ID (EID), 10, 210, 234 
ID, parent (A Xtf&ID), 210, 215, 219, 225, 228, 
234, 263-264, 283, 424 
identifiers (进程 标 识 符 ) 209-210 
relationships (进程 关系 ) 261-287 
system (系统 进程 )，210，312 
termination (进程 终止 )，180-184 
time (进程 时 间 )，20，24，57，257-259 
process group (进程 组 )，269-270 
background (后 台 进 程 组 )，272，275，277，279，281- 
282, 284-285, 296-297, 344, 349, 882 
foreground (前 台 进 程 组 ) 272-278, 280-281, 286, 
294, 296-297, 343, 350, 424-425, 463, 640-642, 
645, 649, 670, 706, 882 
ID (ERAID), 215, 234 
ID, foreground (AT erxt£&£BID), 274, 278, 637 
ID, session (HAAD), 279 
ID, terminal (终端 进程 组 田 ) 278, 423-424 
leader (进程 组 组 长 进程 )，269-271，280，287，425， 
692 
lifetime (进程 组 生命 周期 }，269 
orphaned (孤儿 进程 组 )，282-285，428，699 
process-shared attribute (Process-shared 属 性 )，394 
processes, cooperating (合作 进程 )，455，717，883 
program (程序 )，10 
PROT EXEC constant (PROT_EXEC 常 量 ) 487 
PROT NONE constant (PROT_NONE 常 量 ) 487 
PROT READ constant (PROT_READ% $Œ), 487, 491, 539 
PROT WRITE constant (PROT. WRITETE HK), 487, 491, 
539 
protoent structure (protoent 4%), 554 
prototypes, function (函数 原型 ) 807-841 
ps program (ps#8FF), 219, 260, 278, 280-282, 423- 
424, 428, 701, 866 
pselect function (pselect pH), 306, 474, 478-479 
definition of (pselect 函 数 的 定义 )，478 
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pseudo terminal (gti), 675-707 
packet mode 〈 伪 终端 打包 模式 ) 705 
remote mode ( 伪 终 端 远 程 模式 }，706 
signal generation ( 伪 终 端 信号 发 生 ) 706 
window size (的 终端 窗口 大 小 ) 706 
psignal function (psignal 国 数 )，3S2 
definition of (psignal 函 数 的 定义 ) 352 
ptem STREAMS module (ptem STREAMS 模 块 )，468， 
676, 685 
pthread structure (pthread 结 构 ) 357 
pthread_atfork function (pthread_atfork 国 数 )， 
417-419 
definition of (pthread_atfork 国 数 的 定义 ) 417 
pthread_attr_des troy function (pthread_attr_ 
destroy 国 数 ) 389-390 
definition of (pthread_attr_destroyMRH# X. ), 
389 
pthread_attr_getdetachstate function 
l (pthread_attr_getdetachstatemH), 390 
definition of (pthread_attr_getdetachstatemat 
的 定义 )，390 
pthread_attr_getguardsize 
(pthread_attr_getgquardsizeth#), 392 
definition of (pthread_attr_getguardsize 函 数 的 
定义 )，392 
pthread_attr_getstack function 
(pthread_attr_getstack HR), 391-392 
definition of (pthread_attr_getstack 国 数 的 定义 )， 
391 
pthread_attr_getstackaddr function 
(pthread attr getstackaddrERÉ), 391 
pthread, attr, getstacksize function (pthread 
attr getstacksizeBRW ME), 392 
definition of (pthread, attr. getstacksize(K Ray 
定义 ) 392 
pthread_attr_init function (pthread_attr_ init 
FAB), 388-390 
definition of (pthread_attr_init Mane MX), 389 
pthread_attr_setdetachstate function 
(pthread_attr_setdetachstatepHwy), 389- 
390 
definition of (pthread_attr_setdetachstate PA 
的 定义 )，390 
pthread_attr_setguardsize function 
(pthread_attr_setguardsizem#), 392 
definition of (Pthread_attr_setguardsize 国 数 的 
定义 )，392 
pthread_attr_setstack function 
(pthread_attr_setstack RR), 391-392 
definition of (pthread attr setstackER MERGE X.), 
391 


function 


pthread, attr, setstackaddr function (pthread_ 
attr_setstackaddr Mm), 391 
pthread_attr_setstacksize function (pthread_ 
attr_setstacksizepHe), 392 
definition of (pthread, attr_setstacksize 函 数 的 
定义 )，392 
pthread_attr_t data type (pthread_attr_t 数 据 类 
型 )，388-390，392，410 
pthread_cancel function (pthread_cancel f%), 
365, 410-411, 791 
definition of (pthreadq_cancel 国 数 的 定义 ) 365 
PTHREAD_CANCEL_ASYNCHRONOUS constant 
(PTHREAD CANCEL ASYNCHRONOUSTÉ&), 412 
PTHREAD CANCEL, DEFERRED constant (PTHREAD_ 
CANCEL DEFERREDTÉ T), 412 
PTHREAD. CANCEL, DISABLE constant (PTHREAD.. 
CANCEL, DISABLETÉSE), 410-411 
PTHREAD, CANCEL, ENABLE constant ( PTHREAD_ 
CANCEL_ENABLE# Ht), 410-411 
PTHREAD_CANCELED constant (PTHREAD_CANCELED# 
X), 361, 365 
pthread cleanup pop function ( pthread_ 
cleanup_pop 国 数 ) 365-366, 790, 792 
definition of (pthreadq_cleanup_pop 国 数 的 定义 )， 
365 
pthread_cleanup_push function ( pthread_ 
cleanup_pushiW%r), 365-366 l 
definition of (pthread_cleanup_push i HX), 
365 1 
pthread, cond, broadcast function (pthread | 
cond broadcasttHK NE), 384, 386, 869-870 
definition of (pthread_cond_broadcast MRE 
X), 384 
pthread, cond, destroy function (pthread_cond_ 
destroy), 383, 421 
definition of (pthreaq_cond_destroy 国 数 的 定义 )， 
383 
pthread_cond_init function (pthread_cond_init 
PHB), 382-383, 421 
definition of (pthread_cond_init MaRS), 383 
PTHREAD. COND INITIALIZER constant (PTHREAD.. 
COND_INITIALIZER# $Æ), 382, 385, 414 
pthread_cond_signal function (pthread_cond_ 
signal Bx), 384-385, 415-416 
definition of (pthread_cond_signal MAHI X), 
384 
pthread_cond_t data type (pthread_cond_t 数 据 类 
型 )，382，385, 414 
pthread_cond_timedwait function (pthread_ 
cond_timedwaitm&#r), 383-384, 395, 411 
definition of (pthread, cond, timedwaitR dio 
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X), 383 
pthread, cond wait function (pthread, cond, wait 
国 数 ) 383-385, 395, 411, 415, 795, 869-870 
definition of (pthread_cond_wait 国 数 的 定义 ) 383 
pthread_condattr_destroy function (pthread_ 
condattr_destroyAe#), 401 
definition of (pthread_condattr_destroy MH 
定义 )，401 
pthread_condattr_getpshared function (pthread_ 
condattr_getpshared pHa), 401 
definition of (pthread_condattr_getpshared me 
的 定义 )，401 
pthread_condattr_init function (pthread_ 
condattr_init pe), 401 
definition of (pthread._condattr_init 函 数 的 定义 )， 
401 
pthread_condattr_setpshared function 
(pthread_condattr_setpshared HR), 401 
definition of (pthread_condattr_setpshared me 
的 定义 )，401 
pthread, create function (pthread_create 国 数 )， 
357-360, 362-364, 366, 368, 388-390, 415, 419, 
436, 780, 869 
definition of (pthread_create 国 数 的 定义 ) 357 
PTHREAD_CREATE_DETACHED constant (PTHREAD 
CREATE_DETACHED 常 量 ) 389-390 
PTHREAD CREATE, JOINABLE constant (PTHREAD 
CREATE JOINABLETÉ HE), 389-390 
PTHREAD .DESTRUCTOR ITERATIONS constant 
(PTHREAD DESTRUCTOR, ITERATIONS' E), 388, 
407 
pthread detach function (pthread_detach##), 
367-368, 389 
definition of (pthread_detach 国 数 的 定义 )，368 
pthread, equal function (pthread_equal 国 数 )，357， 
382 
definition of (pthread_egual 国 数 的 定义 )，3S7 
pthread exit function (pthread_exit Rx), 180, 
218, 361-363, 365-366, 406, 787-789, 792 
definition of (pthread_exit 国 数 的 定义 )，361 
pthread_getconcurrency function (pthread 


getconcurrency 国 数 )，393 
definition of (pthread_getconcurrency 国 数 的 定 
SL), 393 
pthread_getspecific function ( pthread 
getspecifichh#r), 408-410 
definition of (pthread getspecificH AE X.), 
408 
pthread, join function (pthread_join%), 361- 
363, 366-367, 411, 869 
definition of (pthread_join 函 数 的 定义 )，361 





pthread_key_create function (pthread_key_ 
create 国 数 ) 406-407, 409 
definition of (pthread_key_create MRS), 
406 
pthread key delete function (pthread_key_ 
delete), 407 
definition of (Pthread_key_delete 国 数 的 定义 )， 
407 
pthread_key_t datatype (pthread_key_t 数 据 类 型 )， 
409 
PTHREAD, KEYS MAX constant (PTHREAD_KEYS_MAX 常 
量 )，388，407 
pthread_kill function (pthread_kill fe), 414 
definition of (pthread_kill MRAM), 414 
PTHREAD, MUTEX, DEFAULT constant (PTHREAD 
MUTEX DEFAULTA E), 395 
pthread mutex, destroy function (pthread_ 
mutex_destroyMa%), 371-372, 375, 378, 382 
definition of (pthread_mutex_destroy ARJEN), 
371 
PTHREAD MUTEX, ERRORCHECK constant (PTHREAD 
MUTEX ERRORCHECK'É ME), 394-395 
pthread mutex init function (pthread  mutex 
init), 371-372, 374, 376, 399, 404 
definition of (pthread, mutex initHE M EX), 
371 
PTHREAD, MUTEX INITIALIZER constant (PTHREAD 
MUTEX_INITIALIZER#&), 371, 374, 376, 385, 
409, 414, 418 
pthread, mutex, lock function (pthread_mutex_ 
lock), 371-372, 374-375, 377, 385-386, 399, 
405, 409, 415, 418-419 
definition of (pthread mutex locki&dEü X), 
371 
PTHREAD, MUTEX NORMAL constant ( PTHREAD_ 
MUTEX  NORMAL?É ER), 394-395 
PTHREAD, MUTEX RECURSIVE constant (PTHREAD_ 
MUTEX RECURSIVEW EK), 394-395, 399, 404 
pthread, mutex t data type (pthread mutex trig 
类 型 ) 371-372, 374, 376, 385, 399, 404, 409, 
414, 418 
pthread mutex, trylock function (pthread 
mutex_trylockm#e), 371, 373 
definition of (pthread_mutex_trylock RAE SL), 
371 
pthread_mutex_unlock function ( pthread_ 
mutex unlockBREr), 371-372, 374-375, 377-378, 
385-386, 399, 405, 409-410, 415, 419 
definition of (pthread_mutex_unlock 函 数 的 定义 )， 
371 
pthread_mutexattr_destroy function (pthread_ 
mutexattr_destroyii#), 393, 404 
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definition of (pthread_mutexattr_destroy any 
定义 ) ，393 
pthread_mutexattr_getpshared 
(pthread_mutexattr_getpsharediR#), 394 
definition of (pthread_mutexattr_getpsharedpf 
数 的 定义 ) 394 
pthread_mutexattr_gettype function (pthread_ 
mutexattr_gettype 函 数 )，395 
definition of (pthreaq_mutexattr_gettype 国 数 的 
定义 )，395 
pthread_mutexattr_init function (pthread_ 
mutexattr_init pe), 393-394, 399, 404 
definition of (pthread_mutexattr_init MR 
X), 393 
pthread_mutexattr_setpshared 


function 


function 
(pthread_mutexattr_setpshared Hy), 394 
definition of (pthread mutexattr. setpsharedEHR 
数 的 定义 )，394 
pthread_mutexattr_settype function (pthread_ 
mutexattr_settype 国 数 ) 395, 399, 404 
definition of (pthread_mutexattr_settype 函 数 的 
定义 )，395 
pthread_mutexattr_t data type ( pthread_ 
mutexattr tfjg M), 393-394, 399, 404 
pthread, once function (Pthread_once 国 数 )，404- 
405，408，410 
definition of (pthread_once 国 数 的 定义 ) 408 
PTHREAD_ONCE_INIT constant (PTHREAD_ONCE_ INIT 
常量 ) 404, 408-409 
pthread_once_init function (pthread_once_ init 
ERE), 409 
pthread, once, t data type (pthread once trig? 
XU), 404, 409 
PTHREAD_PROCESS_PRIVATE constant (PTHREAD_ 
PROCESS PRIVATEN EE), 394 
PTHREAD PROCESS, SHARED constant (PTHREAD 
PROCESS SHAREDTÉ SK), 394 
pthread, rwlock destroy function (pthread_ 
rwlock destroy), 379 
definition of (pthread_rwlock_destroy MANX 
X), 379 
pthread_rwlock_init function ( pthread_ 
rwlock_init aX), 379-380 
definition of (pthread_rwlock_init HRW), 
379 
pthread_rwlock_rdlock function (pthread_ 
rwlock_rdlockm#), 379, 382, 412 
definition of (pthread_rwlock_rdlock Rn), 
379 
pthread_rwlock_t data type (pthread_rwlock 数 据 
类 型 )，380 


pthread_rwlock_timedrdlock function (pthread_ 
rwlock_timedrdlockiM%), 412 
pthread, rwlock timedwrlock function (pthread_ 
rwlock_timedwrlock Hr), 412 
pthread_rwlock_tryrdlock function (pthread_ 
rwlock_tryrdlockrHa), 379, 
definition of (pthread_rwlock_tryrdlock any 
3X), 379 
pthread rwlock trywrlock function (pthread_ 
rwlock_trywrlock a), 379 
definition of (pthread, rwlock, trywrlockBR Ry 
EX), 379 
pthread rwlock unlock function (pthread_ 
rwlock_unlock 国 数 ) 379, 381-382 
definition of (pthread_rwlock_unlockM#), 379 
pthread_rwlock_wrlock function (pthread_ 
rwlock_wrlock pA), 379, 381, 412 
definition of (pthread_rwlock_wrlock RaW x), 
379 
pthread_rwlockattr_destroy function (pthread_ 
rwlockattr_destroy##), 400 
definition of (pthread_rwlockattr_destroy Mx 
的 定义 ) 400 
pthread_rwlockattr_getpshared function 
(pthread_rwlockattr_getpshared M2), 400 
definition of (pthread_rwlockattr_getpshared 
函数 的 定义 )，400 
pthread_rwlockattr_init function (pthread_ 
rwlockattr_init hay), 400 
definition of (pthread_rwlockattr_init MR 
X), 400 
pthread_rwlockattr_setpshared function 
(pthread_rwlockattr_setpsharedM#), 400 
definition of (pthread_rwlockattr_setpshared 
函数 ) 400 
pthread_rwlockattr_t data type (pthread_ 
rwlockattr_t 数 据 类 型 ) 400 
pthread_self function (pthread_sel f HH), 357, 
359, 363 l 
definition of (pthread_self RHEN), 357 
pthread_setcancelstate function (pthread_ 
setcancelstatemamy), 410 
definition of (pthread_setcancelstateMROE 
X), 410 
pthread_setcanceltype function (pthread_ 
setcanceltype 图 数 ) 411-412 
definition of (pthread_setcanceltype 函 数 的 定义 ) 
4l : 
pthread setconcurrency function (pthread | 
setconcurrencyfM#), 393 
definition of (pthread_setconcurrency MRM 
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X), 393 
pthread, setspecific function (pthread_ sets- 
pecificii%r), 408-409 
definition of (pthread_setspecific 函 数 的 定义 )， 
408 
pthread_sigmask function (pthread_sigmask 函 数 )， 
413, 436 
definition of (pthread_sigmask 函 数 的 定义 )}，413 
PTHREAD_STACK_MIN constant (PTHREAD_STACK_MIN 
HH), 388 
pthread t data type (pthread_t 数 据 类 型 )，356-357， 
359, 362-363, 366, 380, 390, 415, 419, 436, 
869 
pthread, testcancel function (pthread_testcancel 
函数 ) 411 
definition of (pthread_testcancel MRAM), 
411 
PTHREAD_THREADS_MAX constant (PTHREAD_THREADS_ 
MAX EE), 388 
pthreads, 27, 211 
ptrdiff_t datatype (ptrdiff_t 数 据 类 型 )，57 
pts STREAMS module (pts STREAMS 模 型 }，468 
ptsname function (Ptsname 国 数 )，402，682-68$，687- 
688, 690 
definition of (ptsnametR RHI SZ), 682, 687, 689 
pty program (ptyfi/F), 285, 675, 679-680, 692, 694- 
707, 773, 882-883 
pty_fork function (Pty_fork 国 数 ) 680, 683, 691- 
696, 704, 706-707 
definition of (pty_fork BAHU SL), 691-692 
ptym open function (ptym_openfH#r), 683, 686, 


691-692, 845 
definition of (ptym_openMaAXhI# X.), 683, 688, 
690 


ptys. fork function (ptys fork), 845 
ptys. open function (ptys_opentW#r), 683, 685-686, 
689, 691-693, 845 
definition of (ptys_open PRABHU SL), 683-684, 688, 
691 
putc function (putc faz), 10, 142-143, 145, 229-230, 
412, 661 
definition of (putc 函 数 的 定义 )，142 
putc unlocked function (putc_unlocked 函 数 )， 
402-403, 412 
definition of (putc_unlocked KRKE), 403 
putchar function (putcharfH), 142, 160, 412, 
509 
definition of (putchar 函 数 的 定义 )，142 
putchar unlocked function (putchar_unlocked 国 
数 )，402-403，412 
definition of (putchar_unlocked 函 数 的 定义 )，403 


putenv function (putenv 函 数 )}，186，194，232，402， 
405, 421 
definition of (putenv 国 数 的 定义 )，194 
putenv_r function (putenv_r fA), 421 
putmsg function (putmsg pH), 411, 461-463, 469, 
548 
definition of (putmsg MRA SL), 463 
putpmsg function (putpmsg hi), 411, 461-463, 548 
definition of (putpmsg 国 数 的 定义 ) 463 
puts function (puts 畏 数 )，142-143，412，859 
definition of (puts 国 数 的 定义 ) 143 
pututxline function (pututxline pututxl]l inex), 
402, 412 
putwc function (putwc 国 数 )，412 
putwchar function (putwchar HH), 412 
PWD environment variable (PWD 环 境 变 量 ) 193 
pwrite function (pwrite 国 数 )，74-75，411，420 
definition of (pwrite 函 数 的 定义 )，75 


Q 


Quarterman, J.S., 33-34, 70, 104, 108, 211, 218, 461, 
487, 888 

QUIT terminal character (QUIT IL-7), 638, 641, 648, 
662 


R 


R_OK constant (R_LOK# E), 96 

race conditions (3£4&42& fF), 227-231, 314, 749, 865, 
867 

Rago, S.A., 83, 147, 266, 460, 462, 889 

raise function (raisepiBr), 306, 311-313, 340 

definition of (raise 国 数 的 定义 ) 312 

rand function (rand 畏 数 ) 402 

rand_r function (rand rERE), 402 

raw terminal mode (JARS HRS), 632, 664, 668, 673, 
696, 699 

Raymond, E.S., 889 

RE_DUP_MAX constant (RE DUP MAX?É EE), 39, 42, 48 

read function (read), 8-10, 20, 57, 59, 61, 67- 
69, 75, 84-86, 104, 115, 117, 120, 135, 144- 
145, 159, 284, 304, 306, 316- 318, 340, 351, 
411, 420, 429, 442-443, 455-456, 458-459, 461- 
463, 469-473, 475, 478, 481, 485-487, 492, 
498-499, 502-503, 511-513, 515, 518, 543, 546, 
548, 565-567, 587, 616, 618, 625-627, 629, 632, 
662-664, 668-669, 697, 702-703, 705, 714, 718, 
768, 799-800, 855-856, 877-878, 882 

definition of (read 函 数 的 定义 })，67 
read mode, STREAMS (STREAMS 读 模式 )，470 
read, scatter (散布 读 ) 483, 607 
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read, lock function (read, lockERSE), 449, 453, 458, 
845 
readdir function (readdirtK NE), 5, 7, 120-125, 402, 
412, 657, 786 
definition of (readdir 函 数 的 定义 )，120 
readdir r function (readdqir_r 国 数 )，402，412 
reading directories ( 读 目 录 )，120-125 
readlink function (readlink 国 数 )，113，11$，306 
definition of (read1link 函 数 的 定义 }，115 
readmore function (readmore 国 数 ) 800, 802 
readn function (readng@#r), 485-486, 702, 768, 844 
definition of (readn 国 数 的 定义 ) 485-486 
readv function (readv 国 数 )，40-42，304，411，441， 
483-485, 493, 548, 568, 607, 718, 732 
definition of (readv 函 数 的 定义 )，483 
readw lock function (readw_lock 函 数 )，449，725， 
845 
real 
^ group ID (实际 组 ID)，91-92, 95, 167, 210, 214, 
234-235, 237, 251, 541 
user ID (Ske FH PID), 39, 42, 91-92, 95, 203, 210, 
214-215, 234-235, 237-241, 251, 257, 262, 264, 
312, 354, S41, 685, 867 
realloc function (reallocm&#), 49, 159, 189-190, 
195, 622-623, 727, 802, 859-860 
definition of (realloc 函 数 的 定义 )，189 
record locking (记录 锁 )，444-459 
advisory (建议 性 记录 锁 )，455 
deadlock (记录 锁 死 锁 ) 450 
mandatory (强制 性 记录 锁 ) 455 
timing, semaphore locking versus (信号 量 锁 与 记录 锁 的 
耗 时 比较 )，533 
recv function (recv 函 数 }，306, 411, 548，566-570， 
582 
definition of (recv 函 数 的 定义 )，567 
recv fd function (recv_fd 函 数 }，603-605，612，617， 
621, 844 
definition of (recv_fd 函 数 的 定义 )，603，605，609 
recv_ufd function (recv_ufd 国 数 )，612 
definition of (recv_ufqd 函 数 的 定义 }，613 
recvfrom function (recvtrom 国 数 )，306，411，S67- 
568, 575-577, 579 
definition of (recvfrom 函 数 的 定义 }，567 
recvmsg function (recvmsg HIM), 306, 411, 568, 606, 
609-610, 613 
definition of (recvmsg 函 数 的 定义 )，568 
redirmod STREAMS module (redirmod STREAMS 模 
H), 468 
reentrant functions (可 重信 国 数 ) 305-308 
regcomp function (regcomp 国 数 )，39，42 
regexec function (regexec 国 数 )，39，42 


register variables (寄存 器 变量 ) 199 
regular file (普通 文件 )，88 
relative pathname (相对 路 径 名 )，$，7，43，49，125 
reliable signals (可 靠 信号 ) 310-311 
remote mode, pseudo terminal (的 终端 远程 模式 ) 706 
remove function (remove 国 数 )，108-113，117，412 
definition of (remove 函 数 的 定义 )，111 
remove_job function (remove_job 函 数 )，785,，795 
rename function (rename 国 数 ) 108-113, 117, 306, 
412 
definition of (rename 国 数 的 定义 )，111 
replace, job function (replace_job 国 数 ) 784 
REPRINT terminal character (REPRINT 终 端 字符 ) 638, 
641, 647, 650, 663 
request function (request az), 618, 625-628 
definition of (request 函 数 的 定义 )，618，628 
reset program (reset 程 序 ) 673, 882 
resource limits (ARAI), 202-206, 215, 234, 297, 
354 
restarted system calls (重启 系统 调用 ) 304-305, 317-318, 
326, 329, 481, 660 
restrict keyword (restrict), 26, 87, 115, 
136, 138, 142-143, 146, 148-149, 151, 153, 173, 
176, 320, 324, 357, 371, 379, 383, 390-392, 
394-395, 400-401, 413, 469, 475, 478, 552, 
555-556, 561, 563, 567, 579 
rewind function (rewindiWa), 139, 147-148, 156, 
412 
definition of (rewind PRA SL), 147 
rewinddir function (rewinddirmy#), 120-125, 412 
definition of (zewinddqir 国 数 的 定义 )，120 
rfork function (rforkgiifí), 211 
Ritchie, D.M., 26, 133, 139, 145, 151, 153, 190, 
460, 585, 592, 846, 854, 887, 889 
RLIM_INFINITY constant (RLIM INFINITYTÉ EK), 203, 
427 
rlim t datatype (rlim t+ 数据 类 型 )，$7，204 
rlimit structure (rlimit##J), 202, 205, 426, 855 
RLIMIT_AS constant (RLIMIT_AS##), 203-205 
RLIMIT_CORE constant (RLIMIT_CORE# EK), 203-205, 
293 
RLIMIT CPU constant (RLIMIT CPUS E), 203-205 
RLIMIT DATA constant (RLIMIT_DATA# &), 203-205 
RLIMIT FSIZE constant (RLIMIT_FSIZE##&), 203- 
205, 354 
RLIMIT INFINITY constant (RLIMIT, INFINITYTÉ ), 
205, 855 
RLIMIT. LOCKS constant (RLIMIT_LOCKS###&), 203- 
205 
RLIMIT_MEMLOCK constant (RLIMIT_MEMLOCK# &), 
203-205 
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RLIMIT NOFILE constant (RLIMIT_NOFILE# #), 
203-205, 427, 855 

RLIMIT. NPROC constant (RLIMIT NPROCT E), 203- 
205 

RLIMIT RSS constant (RLIMIT_RSS#$4), 203-205 

RLIMIT SBSIZE constant (RLIMIT_SBSIZE #), 
203-205 

RLIMIT. STACK constant (RLIMIT_STACK# Æ), 203- 
205 

RLIMIT VMEM constant (RLIMIT VMEMjÉ E), 203-205 

rlogin program (zl1ogin 程 序 ) 677, 705-706 

rlogind program (rloginófRHE), 677-678, 699, 705, 
882 

rmprogram (rm 程序 )，521, 774 

rmdir function (rmdir), 111-112, 116-117, 119- 
120, 306 

definition of (rmdir 函 数 的 定义 }，120 

RMSGD constant (RMSGD 常 量 }，470 

RMSGN constant (RMSGNÆ Æ), 470 

RNORM constant (RNORM# 4), 470 

root 

directory (WAF), 4, 7, 24, 129, 131, 215, 234, 

260, 858 

login name (RAPERA), 16 

routed program (routedfgJF), 431 

RPROTDAT constant (RPROTDAT# KK), 470 

RPROTDIS constant (RPROTDIS' E), 470 

RPROTNORM constant (RPROTNORM 常 量 ) 470 

RS-232, 634, 645-646 

RS_HIPRI constant (RS_LHIPRI# €), 464, 469 

Rudoff, A.M., 147, 266, 429, 545, 890 

runacct program (runacct 程 序 )，250 


S 


s-pipe (s 管 道 )，603，615-616，618，620-621 

S5 file system (S5 文 件 系统 )，62 

S_BANDURG constant (S_BANDURG 常 量 }，482 

S_ERROR constant (S_ERROR 常 量 )，482 

S HANGUP constant (S_HANGUP 常 量 }，482 

S HIPRI constant (S_HIPRI 常 量 )}，482 

S_IFBLK constant (S_IFBLK 常 量 )}，124 

S_IFCHR constant (S_IFCHR 常 量 }，124 

S_IFDIR constant (S_IFDIR 人 常量 )，124 

S_IFIFO constant (S_IFIFO 常 量 ) 124 

S_IFLNK constant (S_IFLNK 常 量 ) 107, 124 

S_IFMT constant (S_IFMT 常 量 )，91 

S_IFREG constant (S_IFREG 常 量 )，124 

S, IFSOCK constant (S_IFSOCK 常 量 )，124，596 

S_INPUT constant (S_INPUT 常 量 )，482 

S_IRGRP constant (S_IRGRP 常 量 }，93，97，100，130， 
433, 592, 844 





S IROTH constant (S_IROTH##), 93, 97, 100, 130, 
433, 592, 844 

S IRUSR constant (S_IRUSR 常 量 ) 93, 97, 100, 130, 
433, 592, 687, 690, 844 

S IRWXG constant (S_IRWKG##), 100, 599 

S_IRWXO constant (S. IRWXO' 4 $Œ), 100, 599 

S_IRWXU constant (S IRWXUd4 d), 100, 599 

S ISBLK functio (S ISBLKPZE), 89-90, 129 

S ISCHR function (S_ISCHR 函 数 ) 89-90, 129, 658 

S_ISDIR function (S_ISDIRHx), 89-91, 123, 658 

S ISFIFO function (S ISFIFOERAÉÉ), 89-90, 497, 514 

S_ISGID constant (S_TSGID#4k), 92, 100, 130, 458 

S ISLNK function (S_ISLNK 函 数 ) 89-90 

S ISREG function (S_ITSREGHSL), 89-90 

S ISSOCK function (S ISSOCKiRMÉ), 89-91, 599 

S ISUIDconstant (S ISUIDT* X), 92, 100, 130 

S_ISVTX constant (S_ISVTXÆ E), 100-102, 130 

S. IWGRP constant (S_IWGRP 常 量 ) 93, 97, 100, 130, 
592, 687, 690 

S IWOTH constant (S_IWOTHÆ E), 93, 97, 100, 130, 
592 

S_IWUSR constant (S IWUSRTEd&), 93, 97, 100, 130, 
433, 592, 687, 690, 844 

S IXGRP constant (S_IXGRP# 44), 93, 100, 130, 458, 
844 

S_IXOTH constant (S  IXOTH dE), 93, 100, 130, 844 

S_IXUSR constant (S_IXUSR# Æ), 93, 100, 130, 844 

S_MSG constant (S_MSG 常 量 ) 482 

S OUTPUT constant (S_OUTPUT# $k), 482 

S. pipe function (s_pipemH), 587-589, 595, 617, 
704, 844 

definition of (s_pipemahy" X.) 589, 595 

S, RDBAND constant (S. RDBANDÉ Æ), 482 

S. RDNORM constant (S_RDNORM# Æ), 482 

S, TYPEISMQ function (S. TYPEISMQINE), 89 

S. TYPEISSEM function (S. TYPEISSEMERAE), 89 

S TYPEISSHM function (S_TYPEISSHMM&X), 89 

S WRBAND constant (S WRBANDAS E), 482 

S WRNORM constant (S_WRNORM# E), 482 

sa program (sa 程序 ) 250 

SA INTERRUPT constant (SA. INTERRUPTA KK), 326, 
328-329 

SA NOCLDSTOP constant (SA_NOCLDSTOP #4), 326 

SA NOCLDWAIT constant (SA NOCLDWAITT1 4), 308, 
326 

SA NODEFER constant (SA NODEFERTÉ E), 326, 328 

SA ONSTACK constant (SA_ONSTACK# 4k), 326 

SA RESETHAND constant (SA_RESETHAND #4), 326, 
328 

SA RESTART constant (SA RESTART 4E E), 304, 326, 
328-329, 481 
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SA SIGINFO constant (SA SIGINFO &), 311, 325- 
326, 328 
sac program (sac 程 序 ) 266 
SAF (Service Access Facility) (服务 访问 设施 ) 266 
Salus, P.H., 889 
Santa Cruz Operation, L SCO 
saved (保存 ) 
set-group-ID (保存 设置 组 下) 53, 91-92 
set-user-ID (保存 设置 用 户 ID )，53，91-92，238-241 ， 
260，264，312，866 
sbrk function (sbrk®#), 21-23, 190, 203 
scan_configfile function (scan_configfilema), 
765-766 
scanf function (scanf a), 41, 140, 151-153, 412 
definition of (scanf 函 数 的 定义 ) 151 
scatter read (散布 读 ) ，483，607 
SCHAR, MAX constant (SCHAR_MRAX 常 量 ) 38 
SCHAR_MIN constant (SCHAR_MIN 常 量 ) 38 
Schwartz，A.，165，232，273，887 
SCM_CREDENTIALS constant (SCM, CREDENTIALS &), 
611-614 
SCM, CREDS constant (SCM, CREDST$ Æ), 611, 613-614 
SCM, CREDTYPE constant (SCM_CREDTYPE# &), 612, 
614 
SCM, RIGHTS constant (SCM_RIGHTS# Æ), 607-608, 
612, 614 
SCO (Santa Cruz Operation), 36 
script program (script#BFF), 675, 678-679, 699, 
701, 706-707 
sed program (sed 程 序 ) 887 
Seebass，S.，889 
seek function (seek®#), 64 
SEEK, CUR constant (SEEK_CUR# 4), 64, 148, 446, 
454-455 
SEEK_END constant (SEEK, ENDE 4), 64, 148, 446, 
454-455, 747 
SEEK, SET constant (SEEK. SET4£ Æ), 64, 148, 446, 
454-455, 458, 491, 873-874 
seekdir function (seekdir&E), 120-125, 412 
definition of (seekdir 函 数 的 定义 ) 120 
SEGV_ACCERR constant (SEGV_ACCERR# KK), 327 
SEGV_MAPERR constant (SEGV_MAPERR# EK), 327 
select function (select HX), 305-306, 318, 339-340, 
411, 441, 474-481, 493, 521, 542, 544, 548, 
563-564, 582, 621, 624-626, 628, 678, 696, 707, 
767-768, 779-780, 870-871, 875, 878, 880-881 
definition of (selecti E X), 475 
Seitzer, M., 710, 889-890 
sem post function (sem posti), 306 
sem timedwait function (sem_timedwait ma), 411 
SEM UNDO constant (SEM_UNDO# &), 531-533 


sem wait function (sem_wait Ma&), 411 
semaphore (信号 量 ) 496, 527-533 
adjustment on exit (exit 时 的 信号 量 调整 ) 532-533 
locking versus record locking timing (信号 量 锁 与 记录 锁 
耗 时 比较 ) 533 
sembuf structure (sembuf 结 构 )，531 
semctl function (semct1 pH), 520, 524, 528-529, 
532 
definition of (semct 1 AAI X), 529 
semget function (semget a), 518-519, 528-529 
definition of (semget RRAHJEN), 529 
semid_ds structure (semid_ds###3), 528-530 
semop function (semopM#), 412, 521, 529-533 
definition of (semop 硝 数 的 定义 )，530 
semun union (semun 联 合 }，529 
send function (send), 306, 411, 548, 565-566, 
570, 581-582 
definition of (sendig ZR gsE V), 565 
send, err function (send_err mH), 603, 615, 618- 
619, 628, 844 
definition of (send, errERZRÉE X.), 603-604 
send, fd function (send_fdi%)}, 603-604, 608, 611, 
615, 618-619, 628, 844 
definition of (send_fd 函 数 的 定义 ) 603-604, 608, 
611 
sendmsg function (sendmsgfi3), 306, 411, 566, 568, 
606, 608-609, 612 
definition of (senGmsg 函 数 的 定义 )，566 
sendto function (sendtof##), 306, 411, 566, 575, 
577, 579 
definition of (sendtofanye X.), 566 
serv. accept function (serv. acceptififfit), 592-593, 
598, 601, 621, 625-627, 844 
definition of (serv_accept MARIE), 592-593, 
599 
serv listen function (serv listen), 592-593, 
597, 621, 625-626, 844 
definition of (serv_1isten 函 数 的 定义 ) ，$92，597 
servent structure (servent 结 构 )，555 
Service Access Facility, 4, SAF 
Session (Zi£), 270-271 
ID (Zi£ID), 215, 234, 271, 286, 423-424 
leader (Zi& t dtf), 271-273, 286, 294, 424-425, 
428, 685, 691-692, 707, 882 
process group ID 【会话 进程 组 也) 279 
session structure (session 结 构 )，286，294，424 
set 
descriptor (RIFE), 475, 477, 493, 875 
signal (fB$), 311, 318-320, 493, 875 


- set-group-ID (HE H4AID), 91-92, 95, 100-101, 103, 119, 


130, 215, 235, 292, 456, 508, 685 
saved (保存 设置 组 卫 ) 53, 91-92 
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set-user-ID (1E RJ P:ID), 91-92, 95, 97, 100-101,-103, 
119, 130, 166, 215, 235, 238-240, 249, 292, 
508, 541-542, 615, 685, 689, 707, 867 
saved ((R&frUt WP ID), 53, 91-92, 238-241, 260, 
264, 312, 866 
set fl function (set. £1), 82, 442-443, 458, 
844, 876 
definition of (set_f1 函 数 的 定义 )，81 
SETALL constant (SETALL'E €), 530, 532 
setasync function (setasync 国 数 ) definition of, 881 
setbuf function (setbuf HH), 136-137, 139, 159, 
229-230, 661, 872 
definition of (setbuf 函 数 的 定义 )，136 
setegid function (setegidm), 241 
definition of (setegid 函 数 的 定义 ) 241 
setenv function (setenv), 194, 232, 402 
definition of (secenv 国 数 的 定义 )，194 
seteuid function (seteuid 国 数 )，241 
definition of (seteuidG 函 数 的 定义 ) 241 
setgid function (setgid 国 数 )，237，241，264，306 
definition of (setgid 函 数 的 定义 ) ，237 
setgrent function (setgrent i), 167-168, 402, 
412 
definition of (setgrent BAAN), 167 
setgroups function (secgroupstRZE), 168 
definition of (setgroups 国 数 的 定义 )，168 
sethostent function (sethostent MH), 412, 553 
definition of (sethostent 国 数 的 定义 ) 553 
sethostname function (sethostnamefRe), 173 
'"setitimer function (setitimerfX), 293, 295, 297, 
354, 875 
setjmp function (setjmp 国 数 ) 179, 195, 197-201, 
206, 314-315, 318, 329-330, 333, 354, 867 
definition of (setJjmp 国 数 的 定义 )，197 
setkey function (setkey 函 数 ) 402 
set logmask function (set1ogmask 国 数 )，430-431 
definition of (set1ogmask 国 数 的 定义 ) 430 
setnetent function (setnetent Ha), 412, 554 
definition of (setnetent 国 数 的 定义 ) 554 
setpgid function (setpgidiRÉE), 269, 306 
definition of (setpgid 函 数 的 定义 ) 269 
setprotoent function (setprotoent ma), 412, 554 
definition of (setprotoent RAMEN), 554 
setpwent function (setpwent BX), 164-165, 402, 
412 
definition of (setpwent BRAVE NM), 164 
setregid function (setregid 函 数 ) 240-241 
definition of (setregid 函 数 的 定义 ) 240 
setreuid function (setreuid&%&), 240 
definition of (setreuid 函 数 的 定义 ) 240 
setrlimit function (setrlimit 上 函数 ) 52, 202, 354 


definition of (setrlimit MARI), 202 
setservent function (setservent May), 412, 555 
definition of (setservent RAMI) 555 
setsid function (setsidgi@), 269, 271, 273, 286, 
306, 424-425, 427, 683, 692-693 
definition of (setsid 函 数 的 定义 )，271 
setsockopt function (setsockopt Ha), 306, 579, 
581, 613 
definition of (setsockopt 函 数 的 定义 )，579 
setspent function (setspent 国 数 )，166 
definition of (setspent 函 数 的 定义 ) 166 
settimeofday function (Ha), 173 
setuid function (setuidgifft), 92, 237-241, 264, 
306, 779 
definition of (setuid 函 数 的 定义 ) 237 
setutxent function (setutxent ma), 402, 412 
SETVAL constant (SETVAL 常 量 ) 530, 532 
setvbuf function (setvbuf žk), 136-137, 139, 159, 
202, 514, 877 
definition of (set vbuf MARI), 136 
SGI (Silicon Graphics, Inc.), 36 
SGID, \lset-group-ID 
shadow passwords (阴影 口令 ) 165-166, 178, 861 
Shannon, W. A., 487, 887 
Shared 
libraries (共享 库 ) 188-189, 207, 719, 863, 885 
memory (共享 存储 ) 496, 533-540 
sharing, file (文件 共享 )，70-73，213 
shell, ， 见 Bourne shell, Bourne-again shell, C shell, Korn 
shell 
SHELL environment variable (SHELL 环 境 变 量 ) 193, 264, 
701 
shell layers (shell 层 )，274 
shell, job-control (作业 控制 shell) 270, 274, 280, 283, 
300, 333, 350, 699 
shells, 3 
SHM, LOCK constant (SHM_LOCK $$), 535 
SHM_RDONLY constant (SHM, RDONLY'E E), 536 
SHM RND constant (SHM_RND# 4), 536 
shmat function (shmat sa), 521, 535-538 
definition of (shmat 函 数 的 定义 ) 536 
shmatt_t datatype (shmatt_t 数 据 类 型 )，534 
shmctl function (shmct 14), 520, 524, 535-537 
definition of (shmct 1HaHIe XM), 535 
shmdt function (shmdt k), 536 
definition of (shmdt 函 数 的 定义 ) 536 
shmget function (shmget a), 518-519, 534, 537 
definition of (shmget MAAN), 534 
shmid ds structure (shmid_ds#§#J), 534-536 
SHMLBA constant (SHMLBA# Wt), 536 
SHRT_MAX constant (SHRT_MAX# #), 38 


bbs.theithome.com 











SHRT_MIN constant (SHRT_MIN##), 38 
SHUT_RD constant (SHUT_RD# $), 548 
SHUT RDWR constant (SHUT RDWR'É E), 548 
SHUT WR constant (SHUT_WR# HR), 548 
shutdown function (shutdown), 306, 548-549, 
567 
definition of (shutdown RHE), 548 
SI ASYNCIO constant (SI_ASYNCIO 常 量 ) 327 
SI_MESGQ constant (ST MESGQTÉ IK), 327 
SI QUEUE constant (SILQUEUE##), 327 
SI TIMERconstant (ST TIMERE $), 327 
SI_USER constant (SI, USER TÉ KK), 327 
sig2str function (sig2str®%X), 353 
definition of (sig2stzr 函 数 的 定义 ) ，353 
SIG2STR_MAX constant (SIG2STR_MRAX 常 量 ) 353 
sig_atomic_t data type (sig atomic 数据 类 型 ) ， 
57, 330, 332, 336-337, 697 
SIG. BLOCK constant (SIG_BLOCK 常 量 ) 321, 323, 334, 
336, 338, 345, 349, 415, 436, 661 
SIG_DFL constant (SIG, DFLTÉ E), 299, 308, 325-326, 
340-341, 350-351, 436 
SIG ERR constant (SIG ERR?TÉ SK), 19, 300, 309, 315- 
318, 322-323, 328-331, 334, 336-337, 343, 511, 
587, 669, 671, 697, 844 
SIG, IGN constant (SIG_IGN 常 量 ) 299, 308, 325, 
341, 344, 350, 427, 844 
SIG, SETMASK constant (SIG_SETMASK#&), 321, 323, 
335-336, 338, 341, 345, 349, 415, 661 
SIG UNBLOCK constant (8G UNBLOCKA E), 321, 323, 
351 
SIGABRT signal (SIGABRT{#), 218, 222-223, 256, 
289, 292-295, 340-342, 354, 867 
sigaction function (sigactiontERÉE), 57, 298, 301, 
304-306, 308, 310-311, 324-329, 341, 344-345, 
349, 414, 427, 436, 438, 482, 576, 880 
definition of (sigactiongE NL), 324 
sigaction structure (sigaction4##4)), 324, 328-329, 
341, 344, 348, 426, 436, 438, 576 
sigaddset function (sigaddset M4), 306, 319, 322, 
334, 336, 338, 344, 349, 351, 415, 438, 661, 
875 
definition of (sigaddset HRA), 319-320 
SIGALRM signal (SIGALRM 信 号) 289-290, 292-293, 
305, 307, 313-315, 317-318, 322, 328-329, 331- 
332, 339, 348-349, 576 
sigaltstack function (sigaltstackiW KE), 326 
SIGBUS signal (SIGBUS 信 和 号) 292-293, 327, 489, 491 
SIGCANCEL signal (SIGCANCEL{#S), 292-293 
SIGCHLD signal (SIGCHLD 信 和 号) 220, 264, 291-293, 
307-308, 310, 326-327, 342-345, 349-350, 430, 
473, 507, 682, 866, 880 
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semantics (语义 ) 308-310 
SIGCLD signal (SIGCLD 信 号 ) 293, 308-311 
SIGCONT signal (SIGCONT 信 号 ) 276, 283, 292-293, 
312, 349-350, 352 
sigdelset function (sigdelset HH), 306, 319, 341, 
349, 875 
definition of (sigdelset mS) 319-320 
sigemptyset function (sigemptyset BARI X), 
306, 319, 322, 328-329, 334, 336-337, 344, 349, 
351, 415, 427, 436, 438, 576, 661, 875 
definition of (sigemptyset 函 数 的 定义 ) 319 
SIGEMT signal (SIGEMT 信 和 号) 292-293 
sigfillset function (sigfil11lset 国 数 )，306，319， 
341，436，875 
definition of (sigfi11lset 函 数 的 定义 )，319 
SIGFPE signal (SITGFPBE 信 号 ) 18, 222-223, 292, 294, 
327 
SIGFREEZE signal (SIGFREEZE 信 号 ) 292, 294 
Sigfunc datatype (Sigfunc 数 据 类 型 )，328-329，844 
SIGHUP signal (SIGHUP 信 号 ) 283-284, 292, 294, 427, 
434-439, 508, 778, 793 
SIGILL signal (SIGILL 信 和 号) 292, 294, 326-327, 340 
SIGINFO signal (SIGINFO 信 和 号) 292, 294, 642, 649 
siginfo structure (siginfoS##j), 226, 326, 328, 
354 
siginfo_t structure (siginfo_t#¥#J), 325 
SIGINT signal (SIGINT), 18-19, 275, 290, 292, 
294, 296, 315-316, 322, 333-336, 339, 342-345, 
347, 415-416, 508, 639, 641, 645, 648-649, 
661-662, 669, 872, 874 
SIGIO signal (SIGIS), 79, 292, 294-295, 473, 
481-482, 583 
SIGIOT signal (SIGIOT 信 和 号) 292, 295, 340 
sigismember function (sigismember Hx), 306, 319, 
322-323, 875 
definition of (sigismember ARIE X.), 319-320 
sigjmp_buf datatype (sigjmp_buf 数 据 类 型 )，330 
SIGKILL signal (SIGKILL 信 和 号)，253，256，291-292， 
295, 299, 321, 353, 699 
siglong jmp function (siglongjmp 函 数 ) 201, 307, 
329-333, 340 
definition of (siglongjmp 函 数 的 定义 ) 330 
SIGLWP signal (SIGLWP{ZS), 292, 295 
signal function (signal), 18-19, 57, 284, 298- 
302, 304-310, 314-318, 322-324, 328-331, 334, 
336-337, 343, 351, 482, 511, 587, 669, 671, 
880 
definition of (signal MAI X), 298, 328 
signal mask (信和 号 屏蔽 字 )，311 
signal set (信号 集 )，311，318-320，493，875 
Signal, intr function (signal_intriMa), 305, 329, 


bbs.theithome.com 








750 索 5 


339, 354, 481, 697, 844, 872 
definition of (signal1_intzr 国 数 的 定义 ) 329 
signal_thread function (signal_threadf%&), 793 
signals (信号 ) 18-19, 289-354 
blocking 〈 信 号 阻塞 ) 310 
delivery (信号 递送 ) 310 
generation (信号 产生 )，310 
generation, pseudo terminal ( 伪 终 端 信号 产生 ) ，706 
job-control (作业 控制 信息 )，349-352 
null ( 空 信号 )，290，312 
pending (未 决 信号 )，310 
queueing (信号 排队 )，311，324 
reliable (可 靠 信 号 ) 310-311 
unreliable (不 可 靠 信 号 ) 301-303 
sigpause function (sigpausemEE), 306, 411 
sigpending function (sigpendingM), 306, 311, 
322-324 
definition of (sigpending 确 数 的 定义 )，322 
SIGPIPE signal (STGPIPE 信 号 ) 290, 292, 295, 469, 
499, 511-512, 515, 518, 543, 587-588, 778, 878 
SIGPOLL signal (SIGPOLLÍA E), 292, 295, 327, 473, 
481-482 
sigprocmask function (sigprocmask®X), 306, 311, 
314, 318, 320-323, 334-336, 338, 341, 345, 349, 
351, 413, 415, 661 
definition of (sigpzrocmask 国 数 的 定义 )，320 
SIGPROF signal (SIGPROF 信 号 ) 292, 295 
SIGPWR signal (SIGPWR 信 和 号) 292, 294-295 
Sigqueue function (sigqueue 国 数 )，306，327-328 
SIGQUIT signal (SIGQUIT 信 号 ) 275, 292, 296, 322- 
323, 336, 342, 344-345, 347, 415-416, 508, 641, 
649, 662, 669 
SIGSEGV signal (SIGSEGV), 290, 292, 296, 307- 
308, 311, 327, 489 
sigset function (sigset HH), 304-306, 308 
sigset_t data type (sigset 上 数据 类 型 ) 57, 311, 
319, 321-322, 334, 336-337, 341, 344, 348, 351, 
414-415, 661 
sigsetjmp function (sigsetjmpiR A), 201, 307, 
329-333 
definition of (sigsetjmpMRh X.) 330 
SIGSTKFLT signal (SIGSTKFLT 信 和 号) 292, 296 
SIGSTOP signal (SIGSTOP{#-S), 291-292, 296, 299, 
321, 349-350 
SIGSUSP signal (SIGSUSP 信 和 号 ) 649 
sigsuspend function (sigsuspend 函 数 的 定义 ) 306, 
314，333-340，349，411 
definition of (sigsuspend 国 数 的 定义 ) 334 
SIGSYS signal (SIGSYS 信 号) 292, 296 
SIGTERM signal, (SIGTERM{#S) 291-292, 296, 300, 
435, 437-439, 669, 697-698, 707, 778, 793, 882 


SIGTHAW signal (SIGTHAW{#}), 292, 296 
sigtimedwait function (sigtimedwaitm#), 411 
SIGTRAP signal (STGTRAP 信 号 ) 292, 296, 326-327 
SIGTSTP signal (SIGTSTP 信 号 ) 275, 283-284, 292, 
296, 349-352, 640, 642, 661, 699 
SIGTTIN signal (SIGTTIN{#S), 275-276, 279, 284, 
292, 296-297, 349-350 
SIGTTOU signal (SIGTTOU 信 号 ) 276-277, 292, 297, 
349-350, 651 
SIGURG signal (SIGURGÍE S), 79, 290, 292, 295, 297, 
482, 581 
SIGUSR1 signal (SIGUSR1 信 号 ) 292, 297, 300, 322, 
330, 332-335, 337-339, 473 
SIGUSR2 signal (STGUSR2 信 号) 292, 297, 300, 337- 
339 
sigvec function (sigvecHi%&), 304-305 
SIGVTALRMsignal (SIGVTALRM{#3), 292, 297 
sigwait function (sigwaitma&), 411, 413-416, 435, 
437, 793 
definition of (sigwa 让 函数 的 定义 ) 413 
sigwaitinfo function (sigwaitinfo 函 数 )，411 
SIGWALTING signal (SIGWAITING 信 和 号) 292, 297 
SIGWINCH signal (SIGWINCH 信 号 ) 286, 292, 297, 
670-671, 706-707 
SIGXCPU signal (SIGXCPU 信 和 号) 203, 292, 297-298 
SIGXFSZ signal (SIGXFSZ 信 号 ) 203, 292, 298, 354, 
868 
SIGXRES signal (SIGXRES 信 和 号) 292, 298 
Silicon Graphics, Inc., W SGI 
Single UNIX Specification, 4,SUS 
Version 3， 见 SUSv3 
single-instance daemons ( 单 实例 守护 进程 ) 432-434 
SIOCSPGRP constant (SIOCSPGRP# 4k), 583 
size program (sizefSFF), 188-189, 207 
size, file (文件 大 小 )，103-105 
size_t data type (size_t 数 据 类 型 )，57-58，68，479， 
854 
sizeof operator (sizeof 操 作 符 }，213 
sleep function (sleep 函 数 )，212，216，225，228， 
253, 255, 284, 306, 309, 314-316, 323, 346-349, 
353-354, 359, 363-364, 400, 411, 419, 477, 493, 
562, 866-868, 870, 873, 878 
definition of (sl1eep 函 数 的 定义 ) 347-348, 871 
Sleep us function (sleep ustÉE), 493, 844 
definition of (sleep_us MAHI X), 875 
SNDPIPE constant (SNDPIPE# 4k), 469 
SNDZERO constant (SNDZERO' E), 469 
snprintf function (snprint fa), 149, 689, 849, 
851 
definition of (snprint KAKKEN) 149 
Snyder, G., 889 
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SO OOBINLINE constant (SO OOBINLINE Ed), 582 
SO, PASSCRED constant (SO PASSCREDAS KK), 613 
SO, REUSEADDR constant (SO REUSEADDR' E Æ), 580- 
581 
SOCK DGRAM constant (SOCK. DGRAM EK), 547, 558, 
563, 567, 576, 578 
SOCK RAW constant (SOCK_RAW#f4k), 547, 558 
SOCK SEQPACKET constant (SOCK_SEQPACKET# X), 
547, 558, 561, 564, 567, 581 
SOCK STREAM constant (SOCK_STREAM# 44), 295, 547, 
558, 561, 564, 567, 569-571, 574, 581, 595-597, 
600 
sockaddr structure (sockaddr), 551-553, 561- 
562, 564, 577-578, 580, 596, 598-601 
sockaddr_in structure (sockaddr_in#¥#J), 551-552, 
559 
Sockaddr, in6 structure (sockaddr_in6#¥#y), 551- 
552 
sockaddr_un structure (sockaddr, un£&4g), 595-601 
sockatmark function (sockatmarki@), 582 
definition of (sockatmark 硝 数 的 定义 )})，582 
socket 
addressing ( 套 接 字 寻 址 ) 549-561 
descriptors (EREHE), 546-549 
file descriptor passing ( 套 接 字 文 件 描述 符 传 递 ) 606- 
614 
IO asynchronous (异步 套 接 字 IO)，582-583 
VO, nonblocking ( 非 阻 塞 套 接 字 IO ) 563-564, 582- 
583 
mechanism (dEHE3-ELl), 89, 496, 545-584 
options (AM), 579-581 
socket function (socket MM), 138, 306, 546-547, 
564, 569, 576, 581, 597-598, 600-601, 797 
definition of (socket HAAIE X.), 546 
socketpair function (socketpairtK EA), 138, 306, 
594-595 
definition of (socketpairtRZRÉ EX), 594 
sockets, UNIX domain (UNIXI&EHtzE), 594-601 
timing (EFRA), 527 
socklen_t datatype (socklen “数据 类 型 ) 562, 564, 
577, 580 
SOL_SOCKET constant (SOL_SOCKET##), 579, 581, 
607-608, 612-614 
Solaris, 3-4, 26-27, 29-30, 35-36, 38, 48, 55-58, 60, 
62, 72, 84, 95, 101-105, 112-113, 119, 121-122, 
128, 162, 166, 169-172, 176, 190-191, 193-194, 
204, 206, 227, 264, 266, 268, 271, 278, 290, 
292-298, 304-305, 308, 310, 326, 330, 348, 
352-353, 357, 360, 430, 445, 455-457, 459-461, 
464, 466, 471, 474-475, 492, 496, 521, 523, 
525, 527, 529, 534-535, 538, 548, 550, 563, 





566-568, 583, 585, 595, 610, 635-638, 644-651, 
664, 676-677, 682-683, 685, 689, 692, 705-707, 
710, 749, 876, 889 
solutions to exercises (习题 答案 ) 853-883 
SOMAXCONN constant (SOMAXCONN# 4k), 563 
Spafford, G., 165, 232, 273, 887 
spawn function (spawn Ha), 216 
spooling, printer (打印 机 假 脱 机 )，757-758 
sprintf function (sprintf), 149, 511, 570, 577, 
600, 617, 619, 621, 628, 725, 738, 807 
definition of (sprintf 硝 数 的 定义 )，149 
spwd structure (spwd 结 构 )，861 
squid login name (squigd 登 录 名 )，162 
sscanf function (sscanfM), 151, 511, 513, 764 
definition of (sscanf 函 数 的 定义 ) 151 
SSIZE_MAX constant (SSTZE_MRAX 常 量 ) 39, 68 
ssize_t datatype (ssize t+ 数据 类 型 )，39，5$7，68 
stack (RR), 187, 197 
Stackaddr attribute (stackadGdGr 属 性 ) 389, 391 
stacksize attribute (stacksizefmft), 389, 391 
standard error (标准 错误 ) 8, 135, 572 
standard error routines. 〈 标 准 出 错 处 理 例 程 ) 846-851 
standard I/O 
alternatives (标准 IO 替代 方案 )，159 
buffering ( 带 缓 冲 的 标准 WO)，135-137，213，217， 
247, 342, 513-514, 680, 718 
efficiency (标准 IO 效率 )，143-145 
implementation (标准 LO 实现 ) 153-155 
library (标准 LO 库 )，9，133-160 
streams (标准 1O 流 )，133-134 
versus unbuffered I/O, timing (标准 IO 与 不 带 缓 冲 的 IO 
的 耗 时 比较 ) 144 
standard input (标准 输入 ) 8, 135 
standard output (标准 输出 ) 8, 135, 572 
standards (标准 ) 25-33 
confiicts (标准 之 间 的 冲突 ) 56-57 
START terminal character (START 终 端 字符 ) 638, 640- 
642, 646, 649, 653 
stat function (stat ma), 4, 7, 62, 87-88, 91-92, 
100, 113-114, 116, 118, 121, 128, 130-131, 306, 
542, 548, 584, 599-600, 658, 856, 858 
definition of (stat 函 数 的 定义 ) 87 
stat structure (stat 结 构 )，87-89，92，103，107，130， 
137, 155, 457, 490, 497, 514, 519, 542, 599, 
657-659 
static variables (静态 变量 ) 201 
STATUS terminal character (STATUS 终端 字符 ) 638, 642, 
647, 649, 663 
stderr variable (stderrat), 135, 443, 695, 849 
STDERR FILENO constant (STDERR_FILENO##) 60, 
135, 573-574, 603, 606, 610, 614, 693 
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stdin variable (stdin 变 量 ) 10, 
512-513, 588, 616 
STDIN FILENO constant (STDIN_FILENO##), 8-9, 
60, 64, 69, 135, 284, 351, 443, 471, 501, 506, 
511-512, 574, 588, 617-618, 639, 644, 669, 671, 
693-695, 697, 704-705 
stdout variable (stdout #@#), 10, 
230, 849, 864, 872 
STDOUT FILENO constant (STDOUT_FILENO# 4), 8-9, 
60, 69, 135, 212, 217, 351, 443, 471, 499, 
506, 511-512, 569, 573-575, 588, 616-618, 693, 
697, 704-705, 864 
Stevens, W. R., 147, 266, 429, 478, 545, 677, 757, 
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stime function (stime 国 数 )，173 
Stonebraker, M.R., 709, 890 
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str mlist structure (str_mlist4$#)), 466-467 
strace program (stracefiHE), 457 
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ioctl operations (STREAMS ioct1#BfE), 464 
Linux (Linux STREAMS), 496 
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connld (connld STREAMS 模 块 )，5$18，590，592， 
600 
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SVR3, 119, 183, 274, 456, 460-461, 

SVR3.2, 36, 248 

SVR4, 3, 21, 33-37, 48, 72, 112, 171, 191, 266, 
271, 285, 428, 460-461, 474, 479, 481, 483, 
592, 681, 709 

swapper process (交换 进程 )，210 

symbolic link (符号 链接 ) ，88-89，102-103，107，110， 
112-114, 121, 127, 131, 170, 856-857 

symlink function (symlink), 115, 306 

definition of (symlink®RRye X.), 115 

SYMLINK_MAX constant (SYMLINK MAX? 4E), 
48 

SYMLOOP MAX constant (SYMLOOP MAXT4€ 1), 39, 42, 
48 

sync function (synch), 59, 77-78 

definition of (sync 国 数 的 定义 ) 77 

sync program (sync 程 序 ) ，77 

synchronization mechanisms (同步 机 制 )， 

synchronous write (同步 写 ) 61, 82-83 

sys_siglist variable (sys siglist^/bE), 352 

sysconf function (sysconf k), 20, 37, 39-54, 57- 


474, 479, 846 


39, 43, 


82-83 


58, 66, 92, 183, 203, 238, 257-258, 306, 356, 
387-388, 391, 394, 401, 489, 571, 573, 578, 
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definition of (sysconf MRAM), 41 
sysctl program (sysct1##FF), 291, 521 
sysdef program (sysdef 程 序 )，521 
syslog function (syslog), 412, 425, 428-433, 
435-439, 570-574, 577-578, 849, 851, 871 
definition of (sys1log 函 数 的 定义 )，430 
syslogd program (sys1ogq 程 序 )，425，429-430，432， 
434，439 
system calls (系统 调用 )，! 
interrupted (中 断 系 统 调 用 ) 303-305, 317-318, 326, 
329, 339, 481 
restarted (重启 系统 调用 ) 304-305, 317-318, 326, 
329, 481, 660 
tracing (跟踪 系统 调用 ) ，457 
versus functions (系统 调用 与 函数 ) 21-23 
system function (system), 23, 119, 209, 231, 
246-250, 258-260, 323, 342-347, 353, 411, 500, 
504, 866, 878 
definition of (system 函 数 的 定义 ) 246-247, 344 
return value (system 国 数 返 回 值 ) 346 
system identification (系统 标识 )，171-173 
system process (系统 进程 )，210，312 
System V (RAEV), 83, 441-442, 445, 460, 462, 473, 
479, 481, 493, 681, 685 
System V Interface Definition, §SVID 
sysyconf function (sysyconf MZ), 57 


TABO constant (TAB0 常 量 )，651 
TAB1 constant (TAB1 常 量 ) 651 
TAB2 constant (TAB2 常 量 ) 651 
TAB3 constant (TAB3 常 量 ) 650-651 
TABDLY constant (TABDLY 常 量 ) 637, 644, 649-651 
tar program (tarfiF), 117, 125, 131-132, 858-859 
tedrain function (tcdraint4), 297, 306, 411, 637, 
653 
definition of (tcdrain 确 数 的 定义 )，653 
tcflag t datatype (tcflag_t 数 据 类 型 )，634 
tcflow function (tcflow®¥), 297, 306, 637, 653 
definition of (tcf1low 函 数 的 定义 )，653 
tcflush function (tcflush€&), 135, 297, 306, 
633, 637, 653 
definition of (tcflush 函 数 的 定义 ) 653 
tcgetattr function (tcgetattr 国 数 ) 306, 635, 637, 
639, 643-644, 651-652, 655, 661, 665-667, 695- 
696 
definition of (tcgetattrMAnie X.) 643 
tcgetpgrp function (tcgetpgrp 图 数 ) 273-274, 306, 
634, 637 
definition of (tcgetpgrp 函 数 的 定义 ) 273 
tcgetsid function (tcgetsid 国 数 )，273-274，634， 
637 
definition of (tcgetsid 函 数 的 定义 ) 274 
TCIFLUSH constant (TCIFLUSH 常 量 ) 653 
TCIOFF constant (TCIOFF 常 量 ) 653 
TCIOFLUSH constant (TCIOFLUSH 常 量 ) ，653 
TCION constant (TCION 常 量 ) 653 
TCOFLUSH constant (TCOFLUSH 常 量 ) ，653 
TCOOFF constant (TCOOFF 常 量 )，653 
TCOON constant (TCOON 常 量 }，653 
TCSADRAIN constant (TCSADRAIN# E), 643 
TCSAFLUSH constant (TCSAFLUSH##), 639, 643, 661, 
665-667 
TCSANOW constant (TCSANOW# Æ), 643-644, 693, 696 
tcsendbreak function (tcsendbreaktiRAE), 297, 306, 
637, 642, 653-654 
definition of (tcsendbreak MARIE), 653 
tcsetattr function (tcsetattrax), 297, 306, 633, 
635, 637, 639, 643-644, 651-652, 661, 665-667, 
693, 696, 703 
definition of (tcsetattrERSE E X.), 643 
tcsetpgrp function (tcsetpgrpERÉE), 273-274, 276, 
278, 297, 306, 634, 637 
definition of (tcsetpgrp 函 数 的 定义 ) 273 
tee program (tee 程 序 )，516 
tell function (tel1 Ha), 64 
TELL CHILD function (TELL CHILD), 229-230, 
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337, 451, 458, 493, 501, 503, 539, 845 
definition of (TELL CHILDEREÉRUZE SL), 338, 502 
TELL, PARENT function (TELL, PARENTÉRME), 229, 337, 

451, 493, 501, 503, 539, 845, 876 
definition of (TELL_PARENTR SRI X.), 338, 502 
TELL WAIT function (TELL WAITENSE), 229-230, 337, 
451, 458, 493, 501, 539, 845, 876 
definition of (TELL_WATIT 函 数 的 定义 ) 337, 502 
telldir function (telldirma), 120-125 
definition of (tel1dqir 国 数 的 定义 ) 120 
telnet program (telnet 程 序 ) ，472，703，706 
telnetd program (telnetdq 程 序 )，267，472-473，677， 
699，866，882 
tempfile function (tempfilemar), 158 
tempnam function (tempnamiRZ), 155-160 
definition of (tempnam 函 数 的 定义 ) 157 
TENEX C shell, 3 
TERM environment variable (TERM 环境 变量 ) 193, 263, 
265 
termcap, 672-673, 890 
terminal 
baud rate (终端 波 特 率 ) 652-653 
canonical mode (终端 规范 模式 ) 660-663 
controlling (终端 控制 )，61，215，234，251，268， 
271-274, 276, 278-279, 281, 284, 286-287, 294, 
296-297, 349, 423-425, 428, 439, 463, 468, 640, 
645, 651, 654, 660, 662, 676, 683, 685, 689, 
691-692, 846, 890 
VO (终端 TD) 631-673 
identification (终端 标识 ) 654-660 
line control (终端 行 控制 ) ，653-654 
logins (终端 登录 )，261-266 
mode, cbreak (cbreak 终 端 模式 ) 632, 664, 668, 673 
mode, cooked (cooked 终 端 模式 ) 632 
mode, raw (原始 终端 模式 ) 632, 664, 668, 673, 
696, 699 
noncanonical mode ( 非 规 范 模式 ) 663-670 
options (终端 选项 ) ，643-651 
parity (终端 奇偶 性 )，648 
process group ID (终端 进程 组 ID) 278, 423-424 
Special input characters (终端 特殊 输入 字符 ) ，638-642 
window size (终端 窗口 大 小 )，286，297，670-672， 
691, 706-707 
termination, process (进程 终止 )，180-184 
terminfo, 672-673, 887, 890 
termio structure (termio 结 构 ) 634 
termios structure (termios 结 构 )，286，634，637-639， 
643-644, 652-653, 655, 661, 663-666, 668, 691- 
F 692, 694, 696, 702, 706-707, 844-845, 882 
text segment (EXE), 186 
The Open Group, 32, 176, 887 


Thompson, K., 71, 165, 211, 709, 889-890 
thread, init function (thread_init a), 404 
threads (£8), 13, 27, 211, 355-386, 540 
concepts (线程 概念 )，355-357 
control (线程 控制 )，387-421 
creation (线程 创建 )，357-360 
synchronization (线程 同步 )，368-385 
termination (线程 终止 )，360-368 
thundering herd (异乎 寻常 地 聚集 ， 惊 群 效应 ) 869 
tick, clock (BBR), 20, 42, 48, 57, 251-252, 257 
time 
and date functions (时 间 和 日 期 函数 )，173-176 
calendar (日 历时 间 )，20，24，57，117，173-175 ， 
246, 251-252 
process (进程 时 间 }，20，24，57，257-259 
values (时 间 值 )，20 
time function (time 国 数 )，173，246，306，331，599- 
600，862，871 
definition of (time 函 数 的 定义 )，173 
time program (time 程 序 }，20 
TIME terminal value (TIME 终 端 值 )，647，663-664，668， 
673，882 
time t data type (time 上 数据 类 型 ) 20, 57, 173, 
175, 178, 854 
timer_getoverrun function (timer, getoverrunt& 
3r), 306 
timer gettime function (timer_gettimefa), 306 
timer. settime function (timer_settimefia), 306, 
327 
times function (times), 42, 57, 257-258, 306, 
484 
definition of (times ARIE X), 257 
times, file (cf), 115-116, 493 
timespec structure (timespec###}), 383, 398-399, 
478 
timeval structure (timeval 结 构 ) 173, 383, 398, 
475, 478, 768, 871, 875 
timing (时 间 ， 计 时 ， 耗 时 ) 
message queues (消息 队列 耗 时 )，527 
read buffer sizes ( 读 缓 冲 区 大 小 时 间 )，70 
read/write versus mmap (read/write 与 nmap 时 
ial), 492 
semaphore locking versus record locking (信和 号 量 锁 与 记 
录 锁 的 耗 时 比较 ) 533 
standard I/O versus unbuffered VO (标准 IO 与 非 缓冲 IO 
的 耗 时 比较 ) 144 
STREAMS-based pipes (基于 STREAMS 的 管道 时 间 )， 
527 
synchronization mechanisms (同步 机 制 时 间 )，82-83 
UNIX domain sockets (UNIX 域 亦 接 字 时 间 ) , 527 
writev versus other techniques (writev 与 其 他 技术 时 
间 ) 484 
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TIOCGPTN constant (TIOCGPTN 常 量 )，689 
TIOCGWINSZ constant (TIOCGWINSZ 常 量 ) 670-671, 
695, 845 
TIOCPKT constant (TIOCPKT#$#), 705 
TIOCPTLCK constant (TIOCPTLCK# #), 690 
TIOCREMOTE constant (TIOCREMOTE# KK), 706 
TIOCSCTTY constant (TIOCSCTTY #4), 273, 692-693 
TIOCSIG constant (TIOCSIG##), 706 
TIOCSIGNAL constant (TIOCSIGNAL#$ €), 706 
TIOCSWINSZ constant (TIOCSWINSZ#$#), 670, 693, 
706 
tip program (tip 程 序 ) 673 
TLI (Transport Layer Interface, System V) (RAVE 
TEL), 889 
tm structure (tm 结构 ) 174, 862 
TMP_MAX constant (TMP_MAX #4), 38, 155-156 
TMPDIR environment variable (TMPDIR 环 境 变 量 )，15S7- 
158, 193 
tmpfile function (tmpfilemay), 155-159, 340, 412 
definition of (tmpfile 国 数 的 定义 ) 155 
tmpnam function (tmpnam®a), 38, 155-159, 401, 
412 
definition of (tmpnam 函 数 的 定义 ) 155 
tms structure (tms 结 构 )，257-258 
Torvalds, L., 35 
TOSTOP constant (TOSTOP# EK), 636, 651 
touch program (touchfEHE), 117 
tracing system calls (跟踪 系统 调用 ) 457 
transactions, database (数据 库 事务 ) 889 
Transport Layer Interface，SystemV， 见 TLI 
TRAP BRKPT constant (TRAP. BRKPT E), 327 
TRAP. TRACE constant (TRAP_TRACE# E), 327 
tread function (tread 国 数 )，767-768 
treadn function (treadn 国 数 )，768 
Trickey, H., 211, 889 
truncate function (truncate), 105, 113, 117, 
433 
definition of (truncate Æ), 105 
truncation 
file (文件 截 短 ) 105 
filename (文件 名 截 短 }，62 
pathname (路 径 名 截 短 )，62 
truss program (trussfF), 457 
ttcompat STREAMS module (ttcompat STREAMS% 
块 )，468，676，685 
tty structure (tty 结 构 }，286 
tty_atexit function (tty_atexit 硝 数 )，665，696， 
844 
definition of (tty_atexit MARIE NZ), 668 
tty_cbreak function (tty_cbreak&X), 664, 669, 
844 


definition of (tty_cbreak 硝 数 的 定义 )，665 
TTY_NAME_MAX constant (TTY_NAME_MAX 常 量 }, 39, 42, 
48 
tty. raw function (tty_rawMa&), 664, 669, 673, 
695, 844 
definition of (tty_raw hz), 666 
tty reset function (tty_reset Ha), 664, 669, 844 
definition of (tty_reset MALAI), 667 
tty termios function (tty_termios 国 数 ) 665, 844 
definition of (tty_termios MARIE), 668 
ttymon program (ttymonf&lT), 266 
ttyname function (ttynamema), 127, 257, 402, 
412, 655-656, 659, 687 
definition of (ttynamerfZERysE X.), 655, 658 
ttyname_r function (ttyname rjf), 402, 412 
type attribute (类 型 属性 ) 394 
typescript file (typescript 文 件 )，678，701 
TZ environment variable (Tz 环境 变量 }，174，176，178， 
193, 862 
TZNAME_MAX constant (TZNRAME_MAX 常 量 ) 39, 42, 48 


U 


UCHAR MAX constant (UCHAR, MAX'É &), 38 
ucontext, t structure (ucontext_ 上 结构) 328 
UFS file system (UFS XIRA), 48, 55, 62, 105, 108, 
119 
UID, user ID 
uid t datatype (uid_t 数 据 类 型 )，57 
uint16_t datatype (uint16_t 数 据 类 型 }，551 
uint32_t datatype (uint32.t 数 据 类 型 )，551 
UINT_MAX constant (UINT_MAX 常 量 )，38 
ulimit program (ulimit 程 序 )，51-52，204 
ULLONG_MAX constant (ULLONG_MAX 常 量 )，38 
ULONG_MAX constant (ULONG_MAX 常 量 )，38 
umask function (umask 函 数 )，97-100，204，306，425， 
427 
definition of (umask 函 数 的 定义 ) 97 
umask program (umasKk 程 序 ) 98-99, 131 
un, lock function (un_lockma&), 449, 725, 728, 
845 
uname function (unameggE), 171, 178, 306 
definition of (uname 函 数 的 定义 ) 171 
uname program (uname 程 序 )，172，178 
unbuffered VO (不 带 缓 冲 的 IO ) 8, 59-86 
unbuffered I/O timing, standard I/O versus (标准 LO 与 不 带 
缓冲 的 VO 的 耗 时 比较 ) 144 
ungetc function (ungetcH), 141-142, 412 
definition of (ungetcMRAEM), 141 
ungetwc function (ungetwc&), 412 
uninitialized data segment (未 初始 化 的 数据 段 }，187 
UNIX Architecture (UNIX 体 系 结构 )，1-2 
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UNIX domain sockets (UNIX 域 套 接 字 ) 594-601 
timing (UNIX 域 套 接 字 时 间 )，527 
UNIX System implementations (UNIX 系 统 实现 ) 33 
Unix-to-Unix Copy, W, UUCP 
UnixWare, 36, 309-310 
unlink function (unlinke@%&), 107-114, 117, 131, 
157, 306, 340, 412, 456, 515, 592, 598-601, 
857, 859, 878 
definition of (unlink EB SM), 109 
unlockpt function (unlockpt Haz), 682-685, 688, 
690 
definition of (unlockpt BALAI), 682, 687, 690 
Unrau, R., 159, 492, 888 
unreliable signals 《不 可 靠 依 号) 301-303 
unsetenv function (unsetenvi& €), 194, 402 
definition of (unsetenviR RHI), 194 
update program (updatef&/T), 77 
update, jobno function (update_jobnom%), 782, 
795 
uptime program (uptime#F*), 568, 570, 572, 574- 
575, 577, 579, 584 
USER environment variable (USER 环 境 变量 ) 192, 264 
userID (HAID), 16, 237-241 
effective (有 效用 户 ID) 91-92, 94-95, 99, 103, 117, 
130, 210, 214, 235, 237-241, 257, 262, 264, 
312, 354, 520, 524, 530, 535, 542-543, 593, 
600, 605, 771, 861, 866 
real (BRA P:ID), 39, 42, 91-92, 95, 203, 210, 
214-215, 234-235, 237-241, 251, 257, 262, 264, 
312, 354, 541, 685, 867 
USHRT MAX constant (USHRT. MAX EE), 38 
usleep function (usleepHxz), 411, 493, 875 
UTC (Coordinated Universal Time) (国际 标准 时 ， 协 调 世 
Fy) 20, 173, 175-176 
utimbuf structure (ut imbuf4##y), 116, 118 
utime function (ut imer), 116-119, 131, 306, 858 
definition of (ut imeERTEHUgE X.), 116 
utmp file (utmp3¢##), 170-171, 257, 287, 698-699, 
866, 871 
utmp structure (utmp£& Ej), 171 
utsname structure (utsnamef##J), 171-172, 178 
UUCP (Unix-to-Unix Copy), 172 
uucp program (uucp 程 序 ) 473 


V 


v-node (vh), 71-72, 74, 126, 287, 602, 855, 887 
va. end function (va endi), 847-848, 850 
va list datatype (va_liist 数 据 类 型 )，847-850 
va, start function (va_start 3x), 847-848, 850 
variables 

automatic 【自动 变量 ) 187, 197, 199, 201, 207 








global (全 局 变量 ) 201 
Tegister (寄存 器 变量 ) ，199 
static (静态 变量 ) ，201 
volatile ( 易 失 变量 )，199，201，315，332 

VDISCARD constant (VDISCARD 常 量 )，638 

VDSUSP constant (VDSUSP 常 量 )，638 

VEOF constant (VEOF 常 量 ) 638-639, 664 

VEOL constant (VEOL 常 量 ) ，638，664 

VEOL2 constant (VEOL2 常 量 ) ，638 

VERASE constant (VERRSE 常 量 ) 638 

VERASE2 constant (VERRASE2 常 量 ) 638 

vfork function (vtfork 国 数 )，211，216-218，260，864- 

865 

vfprintf function (vfprintfig4), 151, 412 
definition of (viprintf RRA), 151 

v£scanf function (vfscanf HX), 153 
definition of (vfscanf 函 数 的 定义 ) 153 

vfwprintf function (vEwprint £ H¥x), 412 

vi program (vi##FF), 350, 457, 459, 632, 671-673, 

882 

VINTR constant (VINTR 常 量 ) 638-639 

vipw program (vipw 程 序 )，163 

VKILL constant (VKILL 常 量 ) 638 

VLNEXT constant (VLNEXT 常 量 ) 638 

VMIN constant (VMIN 常 量 ) 663-665, 667 

vnode structure (vode 结 构 ) 286-287 

Vo, K.P, 125, 159, 887-888, 890 

volatile variables ( 易 失 变量 ) 199, 201, 315, 332 

vprintf function (vprintf&E), 151, 412, 854 
definition of (vprintfiTEByE X.), 151 

VQUIT constant (VQUIT 常 量 ) 638 

vread function (vreadifi), 487 

VREPRINT constant (VREPRINT# HE), 638 

vscanf function (vscanf iS), 153 
definition of, (vscanf MRA), 153 

vsnprintf function (vsnprint ia), 151, 849, 851 
definition of (vsnprintf AREN), 151 

vsprintf function (vsprint fa), 151, 431 
definition of (vsprintf 函 数 的 定义 ) ，151 

vsscanf function (vsscant 4x), 153 
definition of (vsscanf MRAM), 153 

VSTART constant (VSTARTAM Æ), 638 

VSTATUS constant (VSTATUS 常 量 ) , 638 

VSTOP constant (VSTOP 常 量 ) 638 

VSUSP constant (VSUSP 常 量 ) 638 

vsyslog function (vsyslogm®#), 432 
definition of (vsyslog 函 数 的 定义 ) 432 

VTO constant (VT0 常 量 ) 651 

VT1 constant (VT1 常 量 ) ，651 

VTDLY constant (VTDLY 常 量 ) 637, 644, 649, 651 

VTIME constant (VTIME 常 量 ) 663-665, 667 
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VWERASE constant (VWERASE 常 量 )，638 
vwprintf function (vwprint fe), 412 
vwrite function (vwritei d), 487 


W 


W_OK constant (W_OK 常 量 ) 96 
wait function (waitiW TK), 22, 213-214, 219-228, 231, 
237, 245, 249, 257, 259, 276, 293, 303-304, 
306-310, 326, 343, 345, 347, 411, 430, 459, 
508, 544, 878 
definition of (wait BRM), 220 
wait3 function (wait3 3%), 227 
definition of (wait3 尔 数 的 定义 )，227 
wait4 function (wait4 国 数 ) 227 
definition of (wait4 函 数 的 定义 )，227 
WAIT. CHILD function (WAIT. CHILDERS), 229, 337, 
451, 493, 501, 539, 845, 876 
definition of (WAIT CHILDE&ÉÉU E X.), 338, 502 
WAIT PARENT function (WAIT PARENTEASE), 229-230, 
337, 451, 458, 493, 501, 539, 845 
definition of (WAIT_PARENTR MAIZE X.), 338, 502 
waitid function (waitidi), 226-227, 257, 411 
definition of (waitid 函 数 的 定义 )，226 
waitpid function (waitpidm%%), 11-13, 19, 219-227, 
f 236, 242, 246-249, 257, 259, 261, 270, 276, 
291, 304, 306, 345, 411, 458, 500, 507-508, 
543-544, 573, 877-878, 880 
definition of (waitpidw@anyz X.), 220 
wall program (wal i#AFF), 685 
wc program (wc 程 序 ) 104 
wchar, t datatype (wchar 上 数据 类 型 ) 57 
WCONTINUED constant (WCONTINUED 常 量 ) 224, 226 
WCOREDUMP function (WCOREDUMP 4%), 221-222 
wcrtomb function (wcrtombimaz), 401 
wcsrtombs function (wcsrtombs š), 401 
wcstombs function (wcstombs ia), 402 
wctomb function (wctomb 国 数 ) 402 
Weeks, M.S., 188, 887 
Weinberger, P.J., 71, 243, 709, 885, 890 
Weinstock, C.B., 890 
WERASE terminal character (WERASE 终 端 字符 ) 638, 
642, 645-647, 663 
WEXITED constant (WEXITED# 4k), 226 
WEXITSTATUS function (WEXITSTATUS RX), 221-222 
who program (who#@FF), 171, 699 
WIFCONTINUED function (WIFCONTINUED 国 数 ) 221 
WIFEXITED function (WIFEXITEDERM&), 221-222 
WIFSIGNALED function (WIFSIGNALEDIRS&), 221-222 
WIFSTOPPED function (WIFSTOPPEDIRAXE), 221-222, 
224 
Williams, T., 285, 890 


window size 
pseudo terminal (的 终端 窗口 大 小 ) 706 
terminal (终端 窗口 大 小 ) 286, 297, 670-672, 691, 
706-707 
winsize structure (winsize 结 构 )，286，670-671，691- 
692, 694, 696, 707, 845, 882 
Winterbottom, P., 211, 889 
WNOHANG constant (NWNOHANG 常 量 ) 224, 226 
WNOWAIT constant (WNOWAIT# Ht), 224, 226 
WORD BIT constant (WORD BITTE), 40 
working directory (工作 目录 ), 7, 13, 43, 49, 107, 
125-126, 162, 193, 215, 234, 291, 426 
worm, Internet (因特网 蠕虫 ) 142 
wprintf function (worint fa), 412 
write (5) 
delayed (HERS), 77 
gather (聚集 写 ) 483, 607 
synchronous (同步 写 ) 61, 82-83 
write function (write), 8-10, 20-21, 57, 59, 61, 
65-66, 68-69, 72, 74-75, 82-85, 117, 135-136, 
145, 155, 159, 212-213, 216, 229, 304, 306, 
317-318, 351, 354, 411, 434, 442-444, 451, 
454-458, 461-463, 468-469, 471, 475, 478, 484- 
488, 491-493, 499-500, 502, 511-513, 515-516, 
521, 527, 543, 546, 548, 565, 569, 575, 587, 
603-604, 616-617, 629, 632, 718, 789, 799, 
855-856, 864, 868, 876-878 
definition of (write 国 数 的 定义 ) ，68 
write mode, STREAMS (STREAMS 写 模式 ) 468 
write program (write 程序 ) 685 
write, lock function (write_lock 国 数 )，449，453， 
458, 781, 845 
writen function (writenpaa), 485-486, 604, 697, 
702, 772, 844 
definition of (writen) 485-486 
writev function (writev@#z), 40-42, 304, 411, 441, 
483-485, 493, 548, 566, 607, 617, 621, 718, 
737, 739, 795, 799 
definition of (writev 函 数 的 定义 ) 483 
writew_lock function (writew_lock 函 数 ) 449, 451, 
725, 735, 752, 845 
wscanf function (wscanf iR), 412 
WSTOPPED constant (WSTOPPED# NE), 226 
WSTOPSIG function (WSTOPSIGER), 221-222 
WTERMSIG function (WTERMSIG 函 数 )，221-222 
wtmp file (wtmp 文 件 )，170-171，287，866 
Wulf, W. A., 890 
WUNTRACED constant (WUNTRACED# $k), 224 
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X/Open, 32, 890 
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X/Open Portability Guide (X/Open 移植 指南 )，32 
Issue 3， 见 XPG3 
Issue 4， 见 XPG4 
X_OK constant (X_OK 常 量 ) 96 
xargs program (xargs 程 序 )，234 
XCASE constant (XCASE 常 量 )，651 
Xenix, 33, 445, 685 
xinetd program (xinetdq 程 序 ) 268 
XPG3 (X/Open Portability Guide, Issue3), 34, 890 
XPG4 (X/Open Portability Guide, Issue 4), 32 
XSI 29-32, 52-55, 74, 88, 100, 102, 105, 121-122, 
125, 133, 150, 152, 156-158, 164, 167, 173, 
193-194, 202, 204, 221, 224, 226-227, 240, 269, 
271, 274, 291-292, 297, 304-305, 308, 317, 


325-326, 329, 391, 394, 401, 428, 430-431, 445, 
460, 474, 483, 487-489, 496, 515, 523-525, 528, 
533, 538, 540, 543-544, 626, 634-635, 637, 645, 
647, 649-651, 681, 683, 686, 709-710, 858 
XSIIPC, 518-522 
XTABS constant (XTABS'ÉME), 650-651 
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Yigit, O., 710, 890 
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zombie ((E5CHE#E), 219-220, 224, 260, 308, 326, 866 
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